#RL
强化学习
ChaoFeiLi
这个作者很懒,什么都没留下…
展开
-
【强化学习】之Policy Gradients
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/5-1-A-PG/目录对比Policy Gradients和Q-learningPolicy Gradients和Q-learning的反向传递不同之处Policy Gradients 的核心思想算法对比Po...原创 2019-05-14 22:14:56 · 560 阅读 · 0 评论 -
【强化学习】之Sarsa
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/3-1-A-sarsa/Sarsa 和Q-learning的过程基本上差不多,这里主要说一下他们的不一样。Sarsa 属于说到做到,Q-learning说到不一定做到。解释:Q-learning在更新Q表的时候,...原创 2019-05-12 23:49:03 · 412 阅读 · 0 评论 -
【强化学习】之Q-learning
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/2-1-A-q-learning/目录名词解释Q-Learning 解释名词解释解释一下莫烦大神中的一些名字s 表示状态的意思(state)探索者在哪一种状态;或者说是步(step)探索者走到了第几步。s...原创 2019-05-12 23:22:27 · 346 阅读 · 0 评论