![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
David Silver强化学习课程笔记
文章平均质量分 76
David Silver强化学习课程笔记
此去会经年
这个作者很懒,什么都没留下…
展开
-
马尔科夫过程(MDP)—— 此去的强化学习笔记(二)
我是跟着David Silver 的视频和PPT(链接:http://davidsilver.uk/teaching/)来学习强化学习的,虽然很多人已经写了很多这方面的笔记了,但是我还是觉得应该学一点,记一点,因为我认为写是一个理清思路、加深理解的好方法。希望能坚持学下去,写下去。笔记主要是翻译并记录PPT中的内容,再加上一些个人的理解。 今天记录的是David课程中的第二讲。我硕士阶段主要是研究网络测量,一个比较小众的方向。进入博士阶段后,一直在思考如何使用强化学习来解决网络测量中的一些问题,以前遇到问原创 2021-08-08 15:51:05 · 537 阅读 · 1 评论 -
此去的强化学习笔记(一)
此去的强化学习笔记(一) 我是跟着David Silver 的视频和PPT来学习强化学习的,虽然很多人已经写了很多这方面的笔记了,但是我还是觉得应该学一点,记一点,因为我认为写是一个理清思路、加深理解的好方法。希望能坚持学下去,写下去。笔记主要是翻译并记录PPT中的内容,再加上一些个人的理解。 强化学习简介 机器学习方法的类型 我们知道机器学习可以分为三种:有监督、无监督、强化学习。David对于三者关系的概括如图1。 图1 讲义中对三种机器学习方法关系的说明 强化学习的特点 是无监督的.原创 2021-06-05 18:10:43 · 113 阅读 · 2 评论