【强化学习的数学理论：导论】

小翔很开心

已于 2023-04-21 12:58:03 修改

阅读量97

点赞数 1

分类专栏：强化学习的数学原理【西湖大学赵世钰】文章标签：机器学习

于 2023-04-21 12:57:00 首次发布

本文链接：https://blog.csdn.net/qq_26930625/article/details/130285387

版权

5 篇文章 0 订阅

订阅专栏

B站听课笔记：
对强化学习原理的基本了解，后续将深入学习。

三个方面的书籍可以参考：
一、Computer science perspective:
计算机科学方面的书籍，可读性好，数学理论内容少。

1、Reinforcement Learning: An introduction.【R.S. Sutton and A.G. Barto， MIT Press, 1998/2018】强化学习邻域的圣经

2、Algorithms for Reinforcement Learning. 【C. Szepesvari Morgan and Claypool Publishers, 2010】

二、Control-theoretic perspective
控制理论方面的书籍，数学推导较多，专业性较强，需要一定的专业背景。

1、Neuro-Dynamic Programming 【D.P. Bertsekas and J. Tsitsiklis Athena Scientific, 1996】

2、Reinforcement Learning and Optimal Control 【D.P. Bertsekas Athena Scientific, 2019】

3、Control Systems and Reinforcement Learning 【S. Meyn Cambridge University Press, 2022】

三、Deep RL

强化学习知识脉络

时间线依次为：

**More details of the history of RL: **
Reinforcement learning: An introduction 【R.S. Sutton and A.G. Barto， MIT Press, 2018】

RL的分类
Supervised learning和Unsupervised learning主要做的是分析、回归；
Reinforcement learning主要做的是决策

强化学习是多学科交叉的，最开始的范式建立是受到了生物的启发。

强化学习和控制系统的范式框架图区别

关注

专栏目录