《强化学习的数学原理》学习笔记
文章平均质量分 94
Oven_maizi
节能中...
展开
-
西湖大学赵世钰老师【强化学习的数学原理】学习笔记2节
强化学习的数学原理是由西湖大学赵世钰老师带来的关于RL理论方面的详细课程,本课程深入浅出地介绍了RL的基础原理,前置技能只需要基础的编程能力、概率论以及一部分的高等数学,你听完之后会在大脑里面清晰的勾勒出RL公式推导链条中的每一个部分。赵老师明确知道RL创新研究的理论门槛在哪,也知道视频前的你我距离这个门槛还有多远。本笔记将会用于记录我学习中的理解,会结合赵老师的视频截图,以及PDF文档进行笔记注释,之后也会补充课程相关的代码样例,帮助大家理解Q:return和state-value的关系是什么?原创 2024-04-27 22:20:00 · 861 阅读 · 0 评论 -
西湖大学赵世钰老师【强化学习的数学原理】学习笔记1节
强化学习的数学原理是由西湖大学赵世钰老师带来的关于RL理论方面的详细课程,本课程深入浅出地介绍了RL的基础原理,前置技能只需要基础的编程能力、概率论以及一部分的高等数学,你听完之后会在大脑里面清晰的勾勒出RL公式推导链条中的每一个部分。赵老师明确知道RL创新研究的理论门槛在哪,也知道视频前的你我距离这个门槛还有多远。本笔记将会用于记录我学习中的理解,会结合赵老师的视频截图,以及PDF文档进行笔记注释,之后也会补充课程相关的代码样例,帮助大家理解。原创 2024-04-27 22:16:30 · 915 阅读 · 0 评论 -
西湖大学赵世钰老师【强化学习的数学原理】学习笔记-1、0节
Reinforcement learning:An introduction.强化学习界的圣经(广泛引用,但是数学内容不多,对深入学习不算友好,同时会有高级知识提前出现在基础内容中,导致学习不太友好)一大类书籍都偏向于通过文字描述,通过直观解释来介绍,另一大类又太过数学化,需要极强的专业背景,中间存在一个Gap等待被填充我们希望从本质去回答去回答算法设计的逻辑,将数学控制在合理的水平,既能清晰展现原理,又不会过于晦涩建议大家循序渐进,按照章节进行学习。原创 2024-04-27 22:11:57 · 952 阅读 · 0 评论