华中科技大学-腾讯联合实验室

华中科技大学-腾讯联合实验室成立于2011年。依托于华中科技大学计算机科学与技术学院。

华中科技大学教授与腾讯相关业务团队建立联合项目组,在云计算、数据中心、并行、分布式计算与系统等领域展开科研项目、人才培养。多名来自华中科技大学-腾讯联合实验室的同学赴腾讯实习,在项目导师的指导下完成科研工作。


合作案例

数据定义的数据中心

基础架构运营在不断的发展前进,正朝着精细化、智能化的方向迈进。对于腾讯的服务器运营而言,如何将40万台服务器的精细化、智能化做好,既有机遇又有挑战。腾讯网络平台部与华中科技大学计算机学院金海教授、吴松教授的团队进行合作,就磁盘健康与故障预测看展“望闻问切”的研究工作。基于大体量的服务器长时间运营积累形成了大数据知识库,

采用机器学习的方法对服务器部件故障预测展开研究,着力于SATA类磁盘的故障预测。同时,结合具体运营的角度,发掘其实用价值和应用场景,为运营精细化、智能化提供支撑。

该项目在2013年一期合作结束后可以达到75%的故障预测准确率。为进一步提升预测准确率,探讨更多可行方案,该合作在2014年初启动了第二期合作,现网测试磁盘故障预测准确率达到90%以上。

基于XEN的跨NUMA节点子机策略

NUMA架构通过提供分离的存储器给各个处理器,突破了传统SMP在内存带宽和CPU可扩展性上的瓶颈。由于他的大体型也使得他很适宜来做为虚拟化使用,但是由于CPU访问remote内存的消耗大于访问local,所以内存与CPU的放置策略就很能影响性能。特别是在虚拟化环境下不仅是VMM侧的策略会影响到内存与CPU的分布,子机侧的调度在跨节点的情况下也会影响性能。默认情况对跨节点子机的处理会严重影响到子机的性能,该合作项目旨在找到一种方法来优化跨节点子机的性能。

腾讯架构平台部与华中科技大学金海教授、吴松教授的团队联合提出了一套适用于NUMA环境下针对跨节点子机的性能优化策略,使得跨NUMA节点的子机性能有明显的性能提升,并对已有的逻辑以及不跨节点的子机不存在任何的影响,同时保证系统的通用和稳定。

基于GPU的图计算性能优化

随着大数据时代的来临,对于数据进行高效准确分析以获取价值的需求变得尤为迫切。大规模数据及其关联性分析,特别是在智能推荐系统、搜索结果相关度评估、社交网络聚类分析等领域,都需要以图数据结构为背景进行描述。由于现有的并行计算系统如Haoop,无法对图数据处理提供高效的支持;面对图并行计算中数据关联性、访问本地性、计算迭代性的三大特征,现有以MapReduce为代表的并行计算框架可能造成数十倍甚至数百倍的性能损失。

因此,面向大规模图计算系统的研究已经成为当前并行与分布式处理领域的重要课题之一。

GPU在机器学习、人工智能等研究领域有着举足轻重的作用,已经成为了高性能计算和并行数据处理的必要选择。华中科技大学-腾讯合作项目拟以GPU为加速平台,借鉴现有的图处理系统,解决图计算过程对GPU并发能力利用率低,数据访问一致性差等问题,实现对图计算的高效支持。