梦想成果
打造互联网大数据环境下目标广告投放的智能化,精准化和最大收益化:
对广告主来说,希望投放效果最优
对媒体来说,希望收益最大化
对社会来说,希望社会效率最优
项目综述
目前广告类目预测主要采用统计机器学习的方法,通过对广告条目进行分词、词性标注,命名实体识别等,提取相关特征,训练分类器等。面临的主要是:其一是广告的title往往很短,只有几个词或十几个词,容易引起特征稀疏的问题;其二是广告数据来源广泛,各个类别下的广告数目分布不均衡,直接训练分类器预测容易造成样本数目较少的类别分类精度下降。为了解决上述问题,在本申请课题中,我们以腾讯数据平台部丰富的用户广告数据为研究对象,以网络挖掘技术为研究手段,从短文本扩展和大类别分类模型建模两个方面展开研究:(1)基于维基百科的短文本分类技术;(2)基于多粒度的大类别分类模型。
代表性成果如下:
(1)论文发表方面
• Guangyou Zhou, Jun Zhao, Tingting He, and Wensheng Wu. An empirical study of topic-sensitive probabilistic model for expert finding in question answer communities. Knowledge-based systems (KBS), 66(1): 136-145. (SCI, IF=3.058)
• Guangyou Zhou, Yubo Chen, Daojian Zeng, and Jun Zhao. Toward Faster and Better Retrieval Models for Question Search. In: 22th ACM Conference on Information and Knowledge Management (CIKM), pages 2139-2148, San Francisco, CA, USA, October 27-November 1, 2013. (Full paper, acceptance rate=16.8%)
• Guangyou Zhou, Yubo Chen, Daojian Zeng, and Jun Zhao. Group Non-negative matrix factorization with natural categories for question retrieval in community question answer archives. In Processing of COLING 2014. Pages 89-98. (CCF B)
• Guangyou Zhou, Jun Zhao, and Daojian Zeng. Sentiment classification with graph co-regularization. In Processing of COLING 2014. Pages 1331-1340-98. (CCF B)
• Guangyou Zhou, Yan Zhou, and Tingting He. Bridging the language gap: learning distributed semantics for cross-lingual sentiment classification. In Processing of NLP&CC
(2)专利情况:
• 中国,国家发明专利,201410201027.7,2014年5月 (申请人:周光有,王巨宏,蒋杰,薛伟,管刚,赵军)
• 中国,国家发明专利,201410200769.8, 2014年5月(申请人:周光有,王巨宏,蒋杰,薛伟,管刚,赵军)
• 中国,国家发明专利,未知,2014年7月 (申请人:周光有,王巨宏,蒋杰,薛伟,管刚,赵军)
• 中国,国家发明专利,未知,2014年7月 (申请人:周光有,王巨宏,蒋杰,薛伟,管刚,赵军)
(3)获奖情况:
• COLING 2014最佳论文奖
我的感言
1. 腾讯提供的研究课题,来源于实际,对于提高青年教师的科研水平具有十分重要的意义;
2. 与腾讯公司优秀的工程师合作,锻炼了我们处理真实问题的能力,在基金的支持下,也在不断成长;
3. 科研合作打下了良好的基础。