知乎上的叶强大大写的笔记,感谢他的分享精神。
作者链接:https://www.zhihu.com/people/qqiang00/posts?page=2
写的很好,整理一下方便用
- 讲解:
- 1.《强化学习》第一讲 简介: https://zhuanlan.zhihu.com/p/28084904
- 2.《强化学习》第二讲 马尔科夫决策过程 :https://zhuanlan.zhihu.com/p/28084942
- 3.《强化学习》第三讲 动态规划寻找最优策略:https://zhuanlan.zhihu.com/p/28084955
- 4.《强化学习》第四讲 不基于模型的预测 :https://zhuanlan.zhihu.com/p/28107168
- 5.《强化学习》第五讲 不基于模型的控制 :https://zhuanlan.zhihu.com/p/28108498
- 6.《强化学习》第六讲 价值函数的近似表示:https://zhuanlan.zhihu.com/p/28223841
- 7.《强化学习》第七讲 策略梯度:https://zhuanlan.zhihu.com/p/28348110
- 8.《强化学习》第八讲 整合学习与规划 :https://zhuanlan.zhihu.com/p/28423255
- 9.《强化学习》第九讲 探索与利用:https://zhuanlan.zhihu.com/p/28428947
- 实践:
- 强化学习实践一 迭代法评估4*4方格世界下的随机策略:https://zhuanlan.zhihu.com/p/28084990
- 强化学习实践二 理解gym的建模思想:https://zhuanlan.zhihu.com/p/28086233
- 强化学习实践三 编写通用的格子世界环境类:https://zhuanlan.zhihu.com/p/28109312
- 强化学习实践四 Agent类和SARSA算法实现:https://zhuanlan.zhihu.com/p/28133594
- 强化学习实践五 SARSA(λ)算法实现:https://zhuanlan.zhihu.com/p/28180443
- 强化学习实践六 给Agent添加记忆功能:https://zhuanlan.zhihu.com/p/28339529
- 强化学习实践七 DQN的实现:https://zhuanlan.zhihu.com/p/28706093
- 作者整理的pdf笔记:https://pan.baidu.com/s/14Jxp3AGPJFgoFkHa4gXgxA#list/path=%2F
- 作者的RL-DEMO GITHUB:https://github.com/qqiang00/reinforce/tree/master/reinforce/codes_for_book