这一系列笔记是基于Richard S. Sutton的《Reinforcement Learning: An Introduction》第二版
因为这本书在出版之前,作者就在官网上发布了几次草稿版,不同时间发布的版本之间的排版有所差异(尤其是2017年和2018年的之间)
本系列基于2018年的几个版本,所以如果文中部分内容所指明的地方和读者看到的不一致,敬请谅解~
《Reinforcement Learning: An Introduction》 读书笔记 - 目录
最新推荐文章于 2025-09-11 16:17:19 发布
本系列笔记基于Richard S. Sutton的《Reinforcement Learning: An Introduction》第二版,涵盖多臂老虎机、有限马尔科夫决策过程等内容。针对不同章节进行详细解析,包括动态规划、蒙特卡洛方法与时序差分学习等核心概念。
1086

被折叠的 条评论
为什么被折叠?



