主要是对基础知识的总结,并给出了策略迭代算法和Q-learning算法收敛的证明(我用latex写的pdf文件,只好上传到网盘)。
链接:https://pan.baidu.com/s/1meYh2_-3hfa-GVjBU3cp9Q
提取码:dd8l
强化学习基础知识小结
最新推荐文章于 2024-05-27 10:11:45 发布
主要是对基础知识的总结,并给出了策略迭代算法和Q-learning算法收敛的证明(我用latex写的pdf文件,只好上传到网盘)。
链接:https://pan.baidu.com/s/1meYh2_-3hfa-GVjBU3cp9Q
提取码:dd8l