强化学习书籍《Reinforcement Learning for Sequential Decision and Optimal Control》读书笔记
该书由清华大学李升波教授撰写的,主要面向工业控制领域的研究者和工程师,曾获得2024年度Springer中国新发展奖(China New Development Awards)。全书按照原理剖析、主流算法、典型示例的架构,系统地介绍了用于动态系统决策与控制的强化学习方法。全书共分为11章,内容涵盖了强化学习的基本概念、蒙特卡洛法、时序差分法、动态规划法、函数近似法、策略梯度法、近似动态规划、状态约束的处理和深度强化学习等知识点。
我的系列博客将对该书进行系统的学习和总结,希望能够对读者有所帮助。博客将按照书籍的单元顺序展开,每个单元的博客链接请参见下方的链接。
书籍及源代码下载网站
书籍及源代码下载网站:https://link.springer.com/book/10.1007/978-981-19-7784-8
博客链接
- U1:强化学习入门
- U2:强化学习基本概念
- U3:Monte Carlo Learning
- U4:TD Learning
- U5:动态规划
- U6:函数近似的间接强化学习(Indirect RL with Function Approximation)
本文为博主原创文章,未经博主允许禁止转载。私自转载将追究相关责任。如有问题,欢迎指正。