清华大学李升波教授强化学习书籍《Reinforcement Learning for Sequential Decision and Optimal Control》系列读书笔记

强化学习书籍《Reinforcement Learning for Sequential Decision and Optimal Control》读书笔记

在这里插入图片描述

该书由清华大学李升波教授撰写的,主要面向工业控制领域的研究者和工程师,曾获得2024年度Springer中国新发展奖(China New Development Awards)。全书按照原理剖析、主流算法、典型示例的架构,系统地介绍了用于动态系统决策与控制的强化学习方法。全书共分为11章,内容涵盖了强化学习的基本概念、蒙特卡洛法、时序差分法、动态规划法、函数近似法、策略梯度法、近似动态规划、状态约束的处理和深度强化学习等知识点。

我的系列博客将对该书进行系统的学习和总结,希望能够对读者有所帮助。博客将按照书籍的单元顺序展开,每个单元的博客链接请参见下方的链接

书籍及源代码下载网站

书籍及源代码下载网站:https://link.springer.com/book/10.1007/978-981-19-7784-8

博客链接

本文为博主原创文章,未经博主允许禁止转载。私自转载将追究相关责任。如有问题,欢迎指正。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值