强化学习
强化学习
宗而研之
计算机视觉应用开发及部署方向
展开
-
SARSA与Q-learning的区别
莫烦强化学习视频 https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/原创 2017-09-13 17:05:12 · 10491 阅读 · 1 评论 -
强化学习之Policy Gradient
参考:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/5-1-policy-gradient-softmax1/Policy gradient 是 RL 中另外一个大家族, 他不像 Value-based 方法 (Q learning, Sarsa), 但他也要接受环境信息 (ob原创 2017-09-18 16:47:03 · 8043 阅读 · 0 评论 -
强化学习之DQN
参考:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/原创 2017-09-18 11:27:00 · 2664 阅读 · 0 评论 -
强化学习之Actor Critic
介绍基于Actot-Critic的几种强化学习方法,包括DDPG、A3C、DDPO等原创 2017-09-18 17:18:48 · 9882 阅读 · 0 评论 -
知乎《强化学习知识大讲坛》学习笔记
转载自:知乎-天津包子馅儿,机器人学博士转载 2017-11-01 10:14:46 · 4277 阅读 · 0 评论 -
强化学习入门及资料
强化学习入门资料转载 2017-10-26 10:04:12 · 2423 阅读 · 0 评论