自动驾驶、强化学习书籍推荐——《Reinforcement Learning for Sequential Decision and Optimal Control》

本文链接：https://blog.csdn.net/brain_wow/article/details/134351186

今天向大家推荐一本清华大学iDlab课题组用五年的时间撰写的强化学习书籍《Reinforcement Learning for Sequential Decision and Optimal Control》， 2023年由Springer出版的强化学习英文书籍。书籍内容知识点全面，章节设计合理，非常适合希望入门和想深入学习强化学习和自动驾驶的同学和科研同仁阅读。下面就由我向大家简单介绍一下这本书。

1.图书简介

本书面向工程领域的科研人员和工程师，按照原理剖析、主流算法、典型示例的架构，介绍用于复杂系统动态决策及最优控制的强化学习方法。本书内容涵盖了强化学习的基本概念、蒙特卡洛法、时序差分法、动态规划法、函数近似法、策略梯度法、近似动态规划、状态约束的处理和深度强化学习等知识点，旨在为领域内的行业同仁提供一本适合入门学习和能力进阶的参考书籍。

2.作者寄语

亲爱的读者们，随着工业领域对复杂决策与控制问题处理需求不断增加，以模仿人类大脑学习机制为原理的强化学习技术，展现出十分广阔的应用前景。然而，强化学习本身所涉及的数理知识深奥，体系比较繁杂，而实际工程应用又充满了各种各样地挑战。为了应对上述挑战，笔者依托在清华大学开设的研究生课程《强化学习与控制》，撰写了这一本教学参考书。在写作本书的过程中，笔者广泛征集了行业专家、领域学者的意见，力求打造一本内容全面、简洁明了的实用教材。期望您在学习过程中能够掌握强化学习的核心概念，熟练地运用各类算法设计，并将其用于解决实际工业控制问题。在此，提前预祝您学习愉快，收获满满！

3.作者简介

李升波

清华大学车辆与运载学院教授，博士生导师。先后留学工作于斯坦福大学，密歇根大学和加州大学伯克利分校。主要从事自动驾驶汽车、强化学习、最优控制与估计等研究。他的研究提出了周期波动型节能操控、网联车群分布式控制、类脑学习集成式决策等核心理论方法，突破了高级别智能汽车自主学习与数据闭环所面临的一系列关键技术难题。获中国自动化学会自然科学一等奖、中国汽车工业科技进步特等奖、国家科技进步二等奖、国家技术发明二等奖等。他是教育部青年科学奖的入选者，曾获得国家高层次科技创新领军人才、交通运输行业中青年科技创新领军人才、清华大学青年教师学术新人奖、清华大学青年教师教学优秀奖等。担任AI国际评测组织MLPerf自动驾驶咨询委员会委员、IEEE智能交通系统学会的理事会委员、中国汽车工程学会青工委首任主任、IEEE OJ-ITS高级副主编、IEEE TITS/IEEE ITSM/IEEE TIV副主编等。