深度强化学习
文章平均质量分 71
将深度学习和强化学习相结合
努力写代码的小梁
这个作者很懒,什么都没留下…
展开
-
【强化学习】Actor-Critic——Pytorch实现
强化学习之actor-critic代码实现原创 2022-09-22 22:24:04 · 2413 阅读 · 1 评论 -
【强化学习】 Nature DQN算法与莫烦代码重现(tensorflow)
DQN,(Deep Q-Learning)是将深度学习与强化学习相结合。在Q-learning中,我们是根据不断更新Q-table中的值来进行训练。但是在数据量比较大的情况下,Q-table是无法容纳所有的数据量,因此提出了DQN。DQN的核心就是把Q-table的更新转化为函数问题,通过拟合一个function来代替Q-table产生Q值。一、DQN算法原理强化学习算法可以分为三大类:value based,policy based和actor critic。以DQN为代表的是value base原创 2022-04-18 21:24:47 · 6104 阅读 · 2 评论