增强学习
yeqiang19910412
这个作者很懒,什么都没留下…
展开
-
策略梯度(Policy Gradients)的理解
策略梯度(Policy Gradients)原创 2017-10-11 09:41:22 · 3199 阅读 · 0 评论 -
Continuous control with Deep Reinforcement Learning与DDPG(Deep Deterministic Policy Gradient)的理解
Continuous control with Deep Reinforcement Learning与DDPG(Deep Deterministic Policy Gradient)的理解原创 2017-11-09 10:26:32 · 1416 阅读 · 0 评论 -
增强学习之时间差分法(TD方法)
增强学习之时间差分法(TD方法)原创 2017-11-13 10:30:40 · 3331 阅读 · 0 评论 -
增强学习之蒙特卡洛方法
增强学习之蒙特卡洛方法原创 2017-11-09 20:35:00 · 510 阅读 · 0 评论 -
DQN(Deep Q-learning)从入门到放弃笔记
DQN(Deep Q-learning)从入门到放弃笔记原创 2017-07-27 14:59:01 · 12115 阅读 · 0 评论 -
莫烦机器学习笔记之小例子
莫烦机器学习笔记之小例子原创 2017-10-14 16:18:10 · 546 阅读 · 0 评论 -
OpenAI Gym使用
OpenAI Gym原创 2017-09-14 09:39:04 · 3779 阅读 · 0 评论 -
强化学习方法归纳
强化学习算法的分类原创 2017-09-14 10:25:26 · 5384 阅读 · 1 评论 -
DQN算法分析
分析了DeepMind在2013年和2015 年提出的深度增强算法原创 2017-07-31 20:43:30 · 45843 阅读 · 1 评论 -
David Silver强化学习公开课之二 马尔科夫决策过程
David Silver强化学习公开课之二 马尔科夫决策过程原创 2017-09-14 20:02:28 · 1122 阅读 · 0 评论 -
David Silver强化学习公开课之一 强化学习入门
David Silver强化学习公开课之一 强化学习入门原创 2017-09-13 16:33:54 · 1252 阅读 · 0 评论 -
DQN实战
DQN实战原创 2017-08-02 10:51:08 · 1579 阅读 · 0 评论