![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
文章平均质量分 87
故人西迁
东南大学自动化在读
展开
-
强化学习:(四)Q-learning, DQN, DDQN是什么?
介绍价值学习方法中Q-learning, DQN, DDQN的联系和区别原创 2021-08-05 21:37:47 · 1323 阅读 · 4 评论 -
强化学习:(三)策略学习
思路:用policy network来近似策略函数 \piπ ,用policy gradient算法来训练这个网络原创 2021-07-31 13:26:26 · 1092 阅读 · 0 评论 -
强化学习:(二)价值学习
介绍了价值学习用TD算法训练DQN的过程原创 2021-07-25 23:42:52 · 402 阅读 · 5 评论 -
强化学习:(一)基本概念
介绍了强化学习的基本术语、如何使用强化学习,以及标准库OpenAI Gym原创 2021-07-24 15:50:33 · 1881 阅读 · 1 评论