深度强化学习
薄荷-塘
致力于复杂系统的相关研究,主要研究方向包括:(1)复杂系统动态建模:基于博弈、基于规则、基于AI;(2)复杂系统的评估:基于模型、基于数据、模型与数据驱动;(3)复杂系统优化:基于智能优化算法,基于强化学习算法。
目前正在研究基于深度强化学习的复杂系统对抗策略研究,针对面向星际争霸的AlphaStar,面向Dota2、Atari等游戏开发的算法,进行相关的深度强化学习算法应用、改进和设计研究。
展开
-
深度强化学习血泪调参史:从人工智障到人工智能
深度强化学习血泪调参史:从人工智障到人工智能背景算法区别功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入背景解决DQN中的过估计(over estimate)问题,DQN中Q值会不断增高,一直到很大很大。你好! 这是你第一次使原创 2020-10-21 15:19:16 · 873 阅读 · 1 评论 -
一图看懂Policy Gradients深度强化学习算法
有想了解DQN算法实现流程图解的童鞋,请移步这里Policy Gradients 深度强化学习算法实现流程详解前言一、PG深度强化学习算法的产生动机?二、算法原理三.算法实现流程总结前言基于Policy Gradients(策略梯度法,后文简称PG)的深度强化学习方法,思想上与基于Q-learning的系列算法有本质的不同,下面本博客争取用简洁的语言,清晰的图表对PG深度强化学习算法进行阐述,帮助初学者更好地理解算法。一、PG深度强化学习算法的产生动机?想要了解PG深度强化学习算法为什么会产生原创 2020-08-23 15:38:17 · 7311 阅读 · 3 评论 -
一图看懂DQN(Deep Q-Network)深度强化学习算法
@[TOC](一图看懂DQN(Deep Q-Network)深度强化学习算法)DQN简介DQN是一种深度学习和强化学习结合的算法,提出的动机是传统的强化学习算法Q-learning中的Q_table存储空间有限,而现实世界甚至是虚拟世界中的状态是接近无限多的(比如围棋),因此,无法构建可以存储超大状态空间的Q_table。不过,在机器学习中, 有一种方法对这种事情很在行,那就是神经网络,可以将状态和动作当成神经网络的输入,然后经过神经网络分析后得到动作的 Q 值,这样就没必要在表格中记录 Q 值,而原创 2020-08-16 10:25:02 · 24744 阅读 · 6 评论