应北大-微软联合实验室之邀,刘铁岩博士首先向200多位北大师生了题为《超大规模机器学习》的报告。刘博士首先简述了已有的分布式机器学习系统,并讨论它们在训练超大规模模型时遇到的困难。接着,刘博士提出为了克服这些困难,微软亚洲研究院人工智能研究组提出了要在机器学习算法和分布式系统两个方面进行创新:他以LDA主题模型和词向量模型的学习过程为例,介绍如何通过精巧的算法改进提高单机版算法的吞吐量和学习效率;并且介绍了微软新近开源的分布式机器学习系统DMTK,讲解它如何通过一些新颖的系统设计(如模型调度,混合式模型存储,自动流水线等)来显著提高多机并行情况下的训练效率; 依托该系统,实现了具有百万主题的LDA模型和具有两千万词表的词向量模型。值得一提的是,刘博士的研究团队实现了仅用24台机器就可实现这些超大模型的训练,而这在之前通常需要数千台机器才能完成。
接着,孙丽君经理为在场同学们介绍了微软亚洲研究院的实习生项目并欢迎同学们前来实习。
讲座之后,北京大学信息科学技术学院王立威教授邀请了刘铁岩博士以及其团队与多位老师进行了学术探讨。张铭教授,王亦洲教授,罗定生教授,崔斌教授,贾金柱副教授,林通教授,宋国杰教授,邓志宏教授,孙栩教授等多位老师参加了讨论,大家就人工智能在自然语言处理,知识挖掘,社交计算,城市计算,数据保密等领域的应用和发展前景做了深入的探讨。
北京大学与微软亚洲研究院比邻而居,在过去的十几年中,双方在人才培养,科研合作,学术交流以及课程创新方面的合作硕果累累。