- 博客(1)
- 收藏
- 关注
原创 强化学习基础知识小结
主要是对基础知识的总结,并给出了策略迭代算法和Q-learning算法收敛的证明(我用latex写的pdf文件,只好上传到网盘)。 链接:https://pan.baidu.com/s/1meYh2_-3hfa-GVjBU3cp9Q 提取码:dd8l ...
2019-07-11 15:44:22 469
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
学习笔记。
主要是对基础知识的总结,并给出了策略迭代算法和Q-learning算法收敛的证明(我用latex写的pdf文件,只好上传到网盘)。 链接:https://pan.baidu.com/s/1meYh2_-3hfa-GVjBU3cp9Q 提取码:dd8l ...
2019-07-11 15:44:22 469
TA创建的收藏夹 TA关注的收藏夹
TA关注的人