- 博客(3)
- 收藏
- 关注
转载 强化学习知识总结(一)
本篇主要是对这段时间以来我在科学网上发的一些强化学习相关的文章进行一个大汇总(Sutton书1-8章内容)。作为对强化学习Tabular方法的一个简单指导性的目录,本篇也会提供之前讨论过的强化学习中的经典问题实现的代码与相关的图表分析的源文件。 K-level相关文章: 【RL系列】Multi-Armed Bandit问题笔记 【RL系列】Multi-Armed Ban...
2018-08-19 09:30:20 713
转载 【强化学习】马尔可夫决策过程与动态编程笔记
转载自:http://blog.sciencenet.cn/home.php?mod=space&uid=3189881&do=blog&id=1123281推荐阅读顺序:Reinforcement Learning: An Introduction (Drfit) 【RL】系列文章:http://blog.sciencenet.cn/home.php?mod=space&...
2018-07-11 12:04:55 774
转载 【RL系列】Multi-Armed Bandit问题笔记
原文地址:http://blog.sciencenet.cn/home.php?mod=space&uid=3189881&do=blog&id=1121466这是我学习Reinforcement Learning的一篇记录总结,参考了这本介绍RL比较经典的Reinforcement Learning: An Introduction (Drfit) 。这本书的正文部分对理...
2018-06-30 20:04:44 1731
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人