8月26日,北京市人民政府公布“关于2019年度北京市科学技术奖励的决定”。根据《北京市科学技术奖励办法》规定,经市科学技术奖励评审委员会评审、市科学技术奖励委员会审定和市政府批准,智源学者文再文被授予北京市杰出青年中关村奖,是中关村人物奖设立以来首批6位获奖者之一。
文再文
北京大学副教授,智源研究员
2009年在美国哥伦比亚大学工业工程与运筹学系取得博士学位。2009年10月至2010年9月由美国加州大学洛杉矶分校纯数学与应用数学研究所和莱斯大学计算与应用数学系联合资助从事博士后研究工作。2012年获得教育部新世纪优秀人才支持计划。2013年获得国家自然科学基金优秀青年基金。2015年获得中组部青年拔尖人才计划。2016年获得中国青年科技奖。文章发表在SIOPT、SISC、SIMAX、SINUM、SIIMS、MPA等国际重要杂志。开发有MGLS、FPC_AS、LMaFit、OptM、ARNT和Arrabit等多个学术软件包。主要研究方向是复合函数优化的算法和理论以及流形约束优化的算法和理论。
文再文团队深入发展随机信赖域框架来求解深度强化学习:通过使用带线搜索的预处理共轭梯度方法来保证每个步长都提升模型并停留在信赖域中;通过增加经验标准偏差来更新信赖域半径从而克服随机设置的函数估计中采样带来的偏差;对于连续空间分别执行均值和协方差极大化以控制熵损失。理论分析表明,算法倾向于产生总预期奖励的单调改善,在适度的条件下可保证全局收敛性。该算法在机器人控制和游戏方面表现出比PPO和TRPO经典算法更优的性能。相关研究工作已形成论文《A stochastic trust region framework for policy optimization》。
另附论文链接:
https://arxiv.org/abs/1911.11640
关于奖项
2019年8月2日,北京市发布新修订的《北京市科学技术奖励办法》,这是该办法自2002年颁布以来最大的一次修改,在奖项设置、奖励等级、提名方式、评审机制等多个方面都有重大改革,首次设立突出贡献中关村奖、杰出青年中关村奖、国际合作中关村奖等三个人物奖。
此次奖励决定中还提到,希望获奖者再接再厉,勇攀高峰,勇担重任,再创佳绩。首都科技工作者要以获奖者为榜样,坚定不移贯彻新发展理念,加快各领域科技创新,着力实现原始创新重大突破,攻克关键核心技术,推动科技成果转化应用,为打造具有全球影响力的科技创新中心,支撑进入创新型国家行列和引领首都高质量发展作出新的更大贡献。
关于我们
北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,简称BAAI)成立于2018年11月,是在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区政府推动成立的新型研发机构。
//智源研究院简介
///
学术思想 | 基础理论 | 顶尖人才 | 企业创新 | 发展政策