#RL
强化学习
ChaoFeiLi
这个作者很懒,什么都没留下…
展开
-
【强化学习】之Policy Gradients
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/5-1-A-PG/ 目录 对比Policy Gradients和Q-learning Policy Gradients和Q-learning的反向传递不同之处 Policy Gradients 的核心思想 算法 对比Po...原创 2019-05-14 22:14:56 · 545 阅读 · 0 评论 -
【强化学习】之Sarsa
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/3-1-A-sarsa/ Sarsa 和Q-learning的过程基本上差不多,这里主要说一下他们的不一样。 Sarsa 属于说到做到,Q-learning说到不一定做到。 解释: Q-learning在更新Q表的时候,...原创 2019-05-12 23:49:03 · 399 阅读 · 0 评论 -
【强化学习】之Q-learning
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/2-1-A-q-learning/ 目录 名词解释 Q-Learning 解释 名词解释 解释一下莫烦大神中的一些名字 s 表示状态的意思(state)探索者在哪一种状态;或者说是步(step)探索者走到了第几步。 s...原创 2019-05-12 23:22:27 · 318 阅读 · 0 评论