![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
xckkcxxck
这个作者很懒,什么都没留下…
展开
-
强化学习 Qlearning小例子
开始入门强化学习,最先看了莫凡大佬的视频,讲解Q-learning算法不得不说真的是通俗易懂。这里是视频地址:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/2-1-general-rl/#│ᆭチツᄍ然后贴一下大神写的代码,以后多多学习。这个小例子对学习理解Q-learning算法十...原创 2018-11-03 20:44:46 · 1789 阅读 · 1 评论 -
强化学习Q-leaning算法之走迷宫
来自于莫凡大神的强化学习教程,今天学习了走迷宫的小例子。网站网址是:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/2-2-A-q-learning/代码如下,一些地方我做了注释:分三个文件1.maze_env.py 用thinker实现了迷宫的布局#!/usr/b...原创 2018-11-04 12:09:37 · 5365 阅读 · 0 评论 -
强化学习Sarsa算法走迷宫小例子
Sarsa算法:Sarsa算法与Q-learing算法的不同之处是什么?一个简单的解释,引用莫凡大神的话:他在当前 state 已经想好了 state 对应的 action, 而且想好了 下一个 state_ 和下一个 action_ (Qlearning 还没有想好下一个 action_) 更新 Q(s,a) 的时候基于的是下一个 Q(s_, a_) (Qlearning 是基...原创 2018-11-04 21:58:30 · 2871 阅读 · 0 评论 -
强化学习 Sarsa-lambda算法走迷宫小例子
Sarsa-lambda是Sarsa算法的一种提速的方法。如果说 Sarsa 和 Qlearning 都是每次获取到 reward, 只更新获取到 reward 的前一步. 那 Sarsa-lambda 就是更新获取到 reward 的前 lambda 步. lambda 是在 [0, 1] 之间取值,如果 lambda = 0, Sarsa-lambda 就是 Sarsa, 只更新获取到...原创 2018-11-05 09:40:40 · 1425 阅读 · 0 评论 -
强化学习 DQN算法
(以下内容取自莫凡大神的教程:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/4-1-A-DQN/)1,什么是DQN:一种融合了神经网络和 Q learning 的方法。2,为什么提出DQN:传统的表格形式的强化学习有这样一个瓶颈,用表格来存储每一个状态 state, 和在...原创 2018-11-05 11:59:10 · 25454 阅读 · 1 评论