自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

策略梯度强化学习

关注数:0 文章数:1 文章阅读量:7413 文章收藏量:55

作者: 薄荷-塘

致力于复杂系统的相关研究,主要研究方向包括:(1)复杂系统动态建模:基于博弈、基于规则、基于AI;(2)复杂系统的评估:基于模型、基于数据、模型与数据驱动;(3)复杂系统优化:基于智能优化算法,基于强化学习算法。 目前正在研究基于深度强化学习的复杂系统对抗策略研究,针对面向星际争霸的AlphaStar,面向Dota2、Atari等游戏开发的算法,进行相关的深度强化学习算法应用、改进和设计研究。
展开