
强化学习
ZONG_XP
这个作者很懒,什么都没留下…
-
原创 SARSA与Q-learning的区别
莫烦强化学习视频 https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/2017-09-13 17:05:128203
1
-
原创 强化学习之Policy Gradient
参考:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/5-1-policy-gradient-softmax1/Policy gradient 是 RL 中另外一个大家族, 他不像 Value-based 方法 (Q learning, Sarsa), 但他也要接受环境信息 (ob2017-09-18 16:47:037608
0
-
原创 强化学习之DQN
参考:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/2017-09-18 11:27:002067
0
-
原创 强化学习之Actor Critic
介绍基于Actot-Critic的几种强化学习方法,包括DDPG、A3C、DDPO等2017-09-18 17:18:488501
0
-
转载 知乎《强化学习知识大讲坛》学习笔记
转载自:知乎-天津包子馅儿,机器人学博士2017-11-01 10:14:463924
0
-
转载 强化学习入门及资料
强化学习入门资料2017-10-26 10:04:122161
0