Hello 冬雨降临,
我们的博硕论坛又在周六
给大家送来温暖啦
这次高性能计算前沿研讨会
将聚焦于
计算架构、云平台设计、高性能计算
等话题
听上去是不是很深入、很”贵系“?
我们邀请了
四位企业嘉宾和两位来自清华计算机系的博士生
分享他们的工作
欢迎同学们踊跃报名参与呐~
嘉宾信息
章晓
01
章晓,本科、硕士毕业于清华大学数学科学系,现任旷视Engine组的深度学习系统架构师。专注于高性能计算、深度学习系统领域。负责旷视GPU深度学习推理优化等方面的研发业务。
分享主题:MegEngineGPU端推理部署
分享内容:MegEngine(天元)是旷视自主研发的一套训练推理一体化、动静态合一的工业级深度学习框架。深度学习训练和推理部署都离不开GPU,借助GPU的算力,我们可以以更快的速度完成模型的训练,以更短的延迟进行模型的部署。MegEngine在GPU上进行了深入的优化,充分挖掘了GPU的计算能力,包括了算子的深度优化和计算图的融合优化。章晓会介绍MegEngine在GPU端的推理部署中的各种优化手段,以及GPU端推理部署未来的发展趋势和面临的挑战。
王洋子豪
02
王洋子豪,北京航空航天大学计算机科学本科,软件工程硕士,加州大学戴维斯分校计算机科学博士。博士期间研究课题为GPU上的图计算编程模型。博士期间完成开源GPU图计算库Gunrock — GPU上性能最优的开源图计算库。
分享主题:见微知著-从数据出发谈Software2.0时代的微信技术架构
分享内容:对微信技术栈和微信业务做简要介绍,以数据中心和技术架构部为例,介绍大数据、高性能图计算、深度学习、推荐系统等方向的技术架构和发展趋势,分享微信技术招聘的信息。
张翼
03
张翼,快手推荐中台负责人。清华计算机系本科,2009 年中科院硕士毕业后加入搜狗,有多年搜索、推荐系统经验,横跨互联网、金融科技等行业。2017 年加入快手推荐团队,担任推荐系统核心架构师,职责涵盖服务治理、架构升级、性能优化等等。协同团队从无到有研发快手推荐中台,并担任团队负责人,打造出快手全业务通用的全品类推荐系统完整解决方案。本职工作聚焦于整体架构设计,核心基础算法能力提升,并提供高效强大的一站式推荐系统支持,支撑着快手新老业务共计上百个推荐场景。
分享主题: 大规模通用智能推荐云平台的设计与挑战
分享内容:快手推荐云是快手研发的服务于全业务全场景的通用推荐系统云平台。作为几亿 DAU 场景下的推荐平台,快手推荐云脱胎于主App核心推荐系统经验,并在核心技术上创新升级,提供了一整套高并发低延迟高吞吐的推荐系统,成功服务了上百个推荐场景。同时,作为有强业务能力,提供完整推荐系统的云平台,快手推荐云在模块通用性,系统一致性,配置灵活性,迭代易用性等方面多管齐下,拥有全业务全链路一站式推荐系统支持的成功范例。本次分享快手建设推荐技术中台、云平台的实践经验和设计思路。
王佳辰
04
王佳辰,毕业于北京大学,网易有道AI高性能计算高级研发工程师,主要从事离线BLAS库的开发优化和机器翻译的端侧落地。
分享主题:有道离线BLAS库在AI端侧中的应用
分享内容:分为以下三部分:端侧AI应用前景、计算特点及第三方离线BLAS库性能分析;有道离线BLAS库的设计背景,设计思路和优化方法;有道离线BLAS库在机器翻译、语音识别和OCR识别中的应用。
费翔
05
费翔,清华大学计算机系2016级直博生,导师为张悠慧教授,目前感兴趣的研究方向是多核体系结构,高性能计算
分享主题: XB-SIM*: A Simulation Framework for Modeling and Exploration of ReRAM-Based CNN Acceleration Design
分享内容:基于忆阻器(ReRAM)的神经网络加速器能极大地提升性能,但这类加速器受ReRAM自身的缺陷以及电路压降等现实因素影响,在大规模使用前需要精确模拟。本文提出一个针对ReRAM加速卷积神经网络CNN的端到端的模拟框架,包括基于ReRAM的神经网络训练算法、面向CNN的形式化的映射策略以及模拟器的并行加速,实验表明该模拟器在CPU/GPU上能达到5.02/34.29倍的加速比。
谢旻晖
06
谢旻晖,清华大学计算机系2019级直博生,导师为陆游游教授和舒继武教授,目前感兴趣的研究方向为SysML、ML4Sys和利用新型硬件设计存储系统。
分享主题: Kraken:Memory-Efficient Continual Learning for Large-Scale Real-Time Recommendations
分享内容:现今工业级推荐系统每天都会使用大量数据训练大规模深度神经网络模型,然而现有的开源系统(包括TensorFlow和PyTorch)在面对百亿级参数模型实时训练的场景时,存在着内存利用低效、扩展性差、无法实时部署等问题。为了更高效地从每天数百TB的工业数据流中训练模型,我们提出一个为实时推荐设计的持续学习系统Kraken。Kraken从系统与算法两方面设计,在有限的内存上优化大规模推荐系统的性能。
活动信息
2020年11月21日(周六) 14:30 - 17:00
本次论坛将采用bilibili线上直播形式
入群方式:添加小A助手微信(微信号:AI TIME_HY)进入交流群
扫码观看直播