自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 强化学习知识总结(一)

本篇主要是对这段时间以来我在科学网上发的一些强化学习相关的文章进行一个大汇总(Sutton书1-8章内容)。作为对强化学习Tabular方法的一个简单指导性的目录,本篇也会提供之前讨论过的强化学习中的经典问题实现的代码与相关的图表分析的源文件。 K-level相关文章: 【RL系列】Multi-Armed Bandit问题笔记 【RL系列】Multi-Armed Ban...

2018-08-19 09:30:20 708

转载 【强化学习】马尔可夫决策过程与动态编程笔记

转载自:http://blog.sciencenet.cn/home.php?mod=space&uid=3189881&do=blog&id=1123281推荐阅读顺序:Reinforcement Learning: An Introduction (Drfit) 【RL】系列文章:http://blog.sciencenet.cn/home.php?mod=space&...

2018-07-11 12:04:55 747

转载 【RL系列】Multi-Armed Bandit问题笔记

原文地址:http://blog.sciencenet.cn/home.php?mod=space&uid=3189881&do=blog&id=1121466这是我学习Reinforcement Learning的一篇记录总结,参考了这本介绍RL比较经典的Reinforcement Learning: An Introduction (Drfit) 。这本书的正文部分对理...

2018-06-30 20:04:44 1693

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除