清华大学李升波教授强化学习书籍《Reinforcement Learning for Sequential Decision and Optimal Control》系列读书笔记

StarMelt

已于 2024-09-18 17:32:53 修改

阅读量433

点赞数 7

文章标签：深度学习人工智能笔记

于 2024-08-07 20:28:04 首次发布

本文为博主原创文章，未经博主允许禁止转载。私自转载将追究相关责任。如有问题，欢迎指正。

本文链接：https://blog.csdn.net/m0_72557046/article/details/141000433

版权

强化学习书籍《Reinforcement Learning for Sequential Decision and Optimal Control》读书笔记

在这里插入图片描述

该书由清华大学李升波教授撰写的，主要面向工业控制领域的研究者和工程师，曾获得2024年度Springer中国新发展奖（China New Development Awards）。全书按照原理剖析、主流算法、典型示例的架构，系统地介绍了用于动态系统决策与控制的强化学习方法。全书共分为11章，内容涵盖了强化学习的基本概念、蒙特卡洛法、时序差分法、动态规划法、函数近似法、策略梯度法、近似动态规划、状态约束的处理和深度强化学习等知识点。

我的系列博客将对该书进行系统的学习和总结，希望能够对读者有所帮助。博客将按照书籍的单元顺序展开，每个单元的博客链接请参见下方的链接。

书籍及源代码下载网站

书籍及源代码下载网站：https://link.springer.com/book/10.1007/978-981-19-7784-8

博客链接

U1：强化学习入门
U2：强化学习基本概念
U3：Monte Carlo Learning
U4：TD Learning
U5：动态规划
U6：函数近似的间接强化学习（Indirect RL with Function Approximation）
- 函数近似的间接强化学习（一）
- 函数近似的间接强化学习（二）

本文为博主原创文章，未经博主允许禁止转载。私自转载将追究相关责任。如有问题，欢迎指正。

关注

7
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。