强化学习知识总结(一)

本篇主要是对这段时间以来我在科学网上发的一些强化学习相关的文章进行一个大汇总(Sutton书1-8章内容)。作为对强化学习Tabular方法的一个简单指导性的目录,本篇也会提供之前讨论过的强化学习中的经典问题实现的代码与相关的图表分析的源文件。

 

K-level

相关文章:

 

Markov 

实例:

1. DP-Programming - Bandit问题

2. DP-Programming - GridWorld

3. Recycling Robot

4. Jack‘s Rental Car

5. Gambler's Problem

相关文章:

 

Monte Carlo

实例:

1. Soap Bubble

2. Black Jack

3. Infinite Variance

4. Monty Hall Problem

5. Race Track

相关文章:

 

TD Methods

实例:

1. Cliff GridWorld

2. Random Walk

3. Windy GridWorld

相关文章:

 

Room Problem & Maze Problem

实例:

1. Room Problem

2. Maze Berrier

3. Dyna-Q

相关文章:

 

相关实例代码(Matlab):

链接:https://pan.baidu.com/s/176TmqhKAoi_rsrvDB9b91A 密码:6hv5

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值