![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
RL
foreverkeen
计算机视觉、强化学习
展开
-
强化学习基础学习系列之强化学习简介
强化学习基础学习系列之强化学习简介在看david silver的强化学习课程,顺便做做笔记,作为回顾复习,有些内容加上了自己的理解,不正确的话还望指出。 下面用到的图片均来自课程中的ppt,就不一一说明了,课程链接:http://www0.cs.ucl.ac.uk/staff/d.silver/web/Home.html,优酷上有中文翻译的:http://v.youku.com/v_show/id原创 2017-09-17 17:33:50 · 1362 阅读 · 0 评论 -
强化学习基础学习系列之MDP
在看david silver的强化学习课程,顺便做做笔记,作为回顾复习,有些内容加上了自己的理解,不正确的话还望指出。 下面用到的图片均来自课程中的ppt,就不一一说明了,课程链接:http://www0.cs.ucl.ac.uk/staff/d.silver/web/Home.html,优酷上有中文翻译的:http://v.youku.com/v_show/id_XMjcwNDA5NzIwOA原创 2017-09-20 14:47:58 · 6091 阅读 · 1 评论 -
强化学习基础学习系列之model-free/planning/model-base/dyna方法总结
model-free/planning/model-base/dyna各种机制的总结介绍前面说的value-base方法(除了动态规划)也好,policy-base的方法也好,都是假设没有模型而直接与实际环境交互来学习的,我们把没有用到模型的方法叫做model-free方法,但并不是说value-base和poli原创 2017-10-17 20:47:45 · 4171 阅读 · 0 评论 -
强化学习基础学习系列之求解MDP问题的value-base方法
解决MDP问题的value-base方法原创 2017-10-13 08:19:10 · 4729 阅读 · 0 评论 -
强化学习基础学习系列之求解MDP问题的policy-base方法
强化学习的policy-base方法原创 2017-10-14 15:55:19 · 2101 阅读 · 0 评论