
强化学习 蘑菇书阅读
文章平均质量分 94
本文主要是针对李宏毅《深度强化学习》进行整理的一篇的整理,全部来源:
王琦,杨毅远,江季,Easy RL:强化学习教程,人民邮电出版社,https://github.com/datawhalechina/easy-rl, 2022.
咪胡
这个作者很懒,什么都没留下…
展开
-
【强化学习】表格型方法 李宏毅 蘑菇书 第三章
本文主要针对**查找表的强化学习方法**(==表格型方法==),讨论**表格型方法是什么**,他的**常见类型和使用的场景**,**常见的算法**,这三个类型给具有一定基础知识的读者介绍表格方法。主要参考李宏毅的蘑菇书原创 2024-12-12 21:11:41 · 737 阅读 · 0 评论 -
【强化学习】 强化学习是什么?为什么?怎么做? 李宏毅 蘑菇书 第一章
主要示意图就是上图,强化学习主要讨论就是智能体(agent)怎么在复杂、不确定的环境(environment)中最大化它能获得的奖励。两个部分就如上述所示,智能体、环境。然后agent交互环境生成一个动作,也被叫做决策,该动作执行,环境就输出下一个状态和奖励。强化学习就是要搞一个最好的一连串的动作。原创 2024-12-10 15:21:40 · 863 阅读 · 0 评论 -
【强化学习】 马尔科夫性 李宏毅 蘑菇书 第二章
本文主要针对强化学习中所需求的马尔科夫决策过程进行详解,讨论**马尔科夫性到底是什么**,**为什么强化学习需要环境有马尔科夫性**,**马尔科夫奖励过程**和**马尔可夫决策过程**是怎么做的,一共四个方面给具有一定基础知识的读者介绍强化学习。原创 2024-12-12 01:02:02 · 1181 阅读 · 0 评论