SIGKDD 被广泛认为是知识发现和数据挖掘研究领域最具影响力的学术会议,被中国计算机学会(CCF)评为推荐CCF-A类会议。近日,SIGKDD 2024 会议放榜,接受率为20%。犀牛鸟精英人才、上海交通大学计算机系博士生刘畅带着在游戏社交网络的社群检测以及好友推荐的研究成果收获两篇 SIGKDD 论文,这是他首次收获 SIGKDD 的论文,相关研究成果也将应用在刘畅同学的博士毕业论文中。
刘畅是上海交通大学计算机系在读博士生,目前主要从事数据挖掘、图神经网络、推荐系统方向的研究。曾在WSDM等多个会议中发表高水平文章。刘畅入选2023腾讯犀牛鸟精英人才计划,在腾讯IEG社交算法团队(https://socialalgo.github.io/)进行研究访学,期间在企业导师林文清专家研究员和学界导师卢宏涛教授、丁玥老师的联合培养下,专注于游戏社交算法的学术研究。
刘畅参加犀牛鸟精英研学营
“卢宏涛教授和丁玥老师是我科研的领路人,他们帮助我在不断的试错中确定了数据挖掘作为自己主要的研究方向,也鼓励我做出真正前沿且能够解决现实问题的研究成果。”2023年,刘畅发现精英计划课题与自己的兴趣和志向十分匹配,一路过关斩将后成功入选精英计划。
刘畅和腾讯IEG社交算法团队基于腾讯游戏丰富的社交场景开展了广泛研究,结合工业界的社交网络具有规模大、语义丰富、类型多样等特点,基于玩家信息和丰富的产品内互动关系,发现挖掘具有网络结构信息和语义特点的社群结构可以更加了解其用户偏好,进而提升社交玩法中的用户体验。刘畅发现该领域现有基于深度图神经网络的社群检测算法无法应对实际业务场景中社群先验知识未知的场景,如社群数目等。因此,他们首次针对属性图上无需先验的社群检测问题提出了一套针对性的图神经网络学习框架 DAG,它基于图神经网络的生成式自监督学习,以及基于社群隶属网络和组稀疏技术来进行自适应的社群数目搜索以及社群检测。该方法首次使得图神经网络模型克服了社群检测中社群数目未知的问题,并已部署于腾讯多款游戏中,相较于目前最先进算法提高了7.35%的新增好友数目。
在这之后,他们在游戏社交的好友推荐以及点击率预测任务中展开了探索。他们发现由于点击率预测的训练数据集由大量二元的点击标签组成,这使得在训练排序模型的过程中会出现大量的平局情况,制约排序模型的性能。因此,他们首次针对二元点击标签的平局问题,提出了超越二元偏好的BBP训练框架,该训练框架基于对用户行为的洞察,将用户的点击行为建模成了一个概率图,并使用贝叶斯方法计算用户和被推荐项目点击率的后验概率,以此作为推荐的增广排序分数。BBP通过引入增广排序分成倍地扩充了可使用训练集,并提高了训练时的计算效率。该方法在点击率预测任务的校准与排序性能均显著超越了当前已知的所有方法,并已长期部署于多款腾讯游戏上,带来了至少10.28%的新增好友数目。
在校企导师的联合指导下,经过不断的论文打磨,刘畅和腾讯IEG社交算法团队将两篇工作提交至SIGKDD会议并被顺利录用。
刘畅参加犀牛鸟精英人才飞盘活动(前排左一)
得知两篇论文均被SIGKDD录用,刘畅激动地说道:“十分感谢企业导师林博的指导和帮助,林博在投稿前反复帮我审查论文手稿并提出数十条建议,甚至陪我打磨到深夜。经过这一年的科研访学,我的科研、工程和写作能力都有明显提高。社交算法团队的科研氛围非常好,大家经常会对新的业务场景交流讨论,每次都让我迸发出新的想法,这两篇论文投稿的思路也都是在和企业导师以及同事的交流中得到的。另外,这一年我们也像朋友那样一起玩了很多把游戏,比如元梦之星。在腾讯的时光真的很充实又快乐!希望我能够继续做出更多有影响力的研究成果。”
企业导师林文清博士表示:“刘畅在精英计划项目期间积极参与业界实际应用项目的技术研发和讨论,可以结合实际应用场景需求提出解决业务痛点的技术方案,并做出了切实可用的落地技术,在较多业务应用场景中取得了不错的效果,希望继续加油,做出更出色更有影响力的工作。”