- 博客(4)
- 收藏
- 关注
转载 强化学习DQN算法
DQN,即Deep Q-learning算法,是将神经网络与Q-learning算法相结合而得到的强化学习算法。在DeepMind发表的论文《Playing Atari with Dee...
2019-12-30 08:02:00 751
转载 基于Policy的强化学习算法
在文章基于Value的强化学习算法中,介绍了Q-learning和SARSA两种经典的强化学习算法。在本篇文章中,将介绍一下基于Policy的经典强化学习算法——Policy Gradi...
2019-12-16 08:09:00 332
转载 基于Value的强化学习算法
在文章强化学习与马尔可夫决策中,介绍了使用马尔可夫决策模型对强化学习的过程进行建模,本篇文章将介绍基于这一模型而引出的一些强化学习的经典算法。Q-learningQ-learning是强...
2019-12-10 08:10:00 297
转载 如何求强化学习最优解
在一篇文章强化学习与马尔可夫决策中,介绍了使用马尔可夫决策过程对强化学习的过程进行建模。通过建模可以得出,只要求解最优价值函数,即可得到对应的最优策略。那么如何求解最优价值函数呢?本篇文...
2019-12-02 08:10:00 1150
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人