标题:2018年4月18日青年博士论坛预告
时间:4月18日(周三)8:40-9:10
地点:仙林校区计算机学科楼327会议室
报告人:刘强
题目:基于Pregel框架的图计算性能优化研究
摘要:同传统大数据处理相比,图数据呈现出动态变化的特点,而现有图计算框架如Pregel等多基于批处理方式,导致大量重复计算和冗余通信。针对该问题,本章利用图计算满足一阶马尔科夫模型的无后效性特点,提出了一种增量式图计算方法。该方法使用宽度优先搜索算法对上传时图结构中的增量部分进行自动检测,找出原始图结构中增量对应的最大连通子图作为变化部分,并在后续作业计算前通过任务间“混洗”操作以交换可复用的中间消息和计算结果;在计算中对未变化部分的顶点数据进行细粒度复用,避免了原方法在每轮超级步中不变顶点带来的重复计算和冗余通信。相比已有方法,该方法在性能和通信量上均有显著提升。此外,针对图计算的其他特点如通信密集和数据局部性差等问题,分别介绍了基于分区的预计算方法和混合分层计算方法。
报告人简介:
刘强,男,西安交通大学计算机系在读博士生,分别于2007年和2011年获得北京邮电大学软件工程学士学位和中国科学技术大学软件工程专业硕士学位,博士期间研究方向为云计算、图计算和大数据处理。在读期间以第一作者发表Frontiers of Computer Science(CCF C)、ISPA(CCF C)等SCI/EI论文5篇,在审期刊论文2篇。申请发明专利1项,授权1项,参与863计划、国家自然科学基金及国家重点研发计划各1项。