强化学习笔记系列入门【0】

最新推荐文章于 2024-11-02 15:22:06 发布

Robo-网络矿产提炼工

最新推荐文章于 2024-11-02 15:22:06 发布

阅读量81

点赞数

分类专栏：计算机视觉 - Opencv 强化学习等的趣味小实验文章标签：笔记

本博客为个人撰写，未经商业授权严禁转载！

本文链接：https://blog.csdn.net/u013537270/article/details/135915404

版权

计算机视觉 - Opencv 强化学习等的趣味小实验专栏收录该内容

58 篇文章 58 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文是作者学习强化学习的心得笔记，强调了翻转课堂的重要性，特别是对于理解复杂的数学公式。文章详细介绍了贝尔曼方程在计算策略状态值中的作用，以及强化学习的特点——系统性和数学性。作者建议结合实践和编程来深入学习，并以Grid world为例解释了易于理解的状态、动作、回报等基础概念。同时，提到了马尔可夫决策过程（MDP）的重要概念，通过普高与重点高中的比喻帮助理解。

摘要由CSDN通过智能技术生成

引言：
最近在学习西湖大学赵世钰老师的强化学习课程，一直觉得学习一定是一个不仅有输入还需要及时给出自己输出的一个过程，但在中国的大学或者研究生课堂，这一部分是相当缺失的，氛围经常性的很差。其实，课堂，我觉得就很有必要去做一些翻转课堂之类的东西，去打破现在这种十分传统的填鸭式教学模式，大学专业性课程、编程类课程的学习，其实很需要学生与老师的一个互动过程（因为，确确实实很多学生其实在课堂上是不愿意提问的，即便是他们真的有些想法或者疑问，他们会因为性格内向等原因，害怕提问是因为自己的不专心（走神）没有听明白任课老师之前说的。而实际上，课堂也很需要这种视频类课程，能够在有走神情况下去反复学习）今天好像又看到更新了一个对他这个整体框架图的一个说明的更新视频。确实这样讲一下，对整个脉络有了更为清楚的认知。但还是发现了一个问题：就是到了后面的高阶章节，一些重要的公式还是直接给出了，那么也就意味着实际上在数学，还是无法完全准确的理解其含义。如果能够给一些这些个重要公式的例子，去多维度的理解这些重要方程就好了。
总结了下翻转课堂的重要性：