智源导读:近年来,深度强化学习技术在游戏人工智能领域、推荐系统、搜索系统、网络优化、供应链优化、自动驾驶和芯片设计等领域取得了大量成果。
华为诺亚方舟决策与推理实验室郝建业近期在北京智源大会上发表了题为《深度强化学习的挑战及落地》的主题演讲。在演讲中,郝建业博士指出,深度强化学习当前存在的挑战主要有三个方面:(1)奖励信号难以设计;(2)强化学习算法学习效率较低;(3)模型泛化能力弱。
整理:任黎明
排版:马瑞军
郝建业博士,华为诺亚方舟决策推理实验室主任。主要研究方向为深度强化学习、多智能体系统。发表人工智能领域国际会议和期刊论文100余篇,专著2部。主持参与国家基金委、科技部、天津市人工智能重大等科研项目10余项,研究成果荣获ASE2019、DAI2019、CoRL2020最佳论文奖等,同时在游戏AI、广告及推荐、自动驾驶、网络优化等领域落地应用。
01