- 博客(1)
- 收藏
- 关注
原创 强化学习导论_Example 6.5: Windy Grid-world
RL_Example 6.5: Windy Grid-world组会汇报时需要整理 《强化学习导论》第二版- Sutton一书中的例题代码,所以将理解过程记录了一下,并且巩固一遍python的基础知识。书中页码:P130, 对应 Chapter 6: Temporal-Difference Learning一、Problem: 1、Grid-world: 7x10 从起点(3,0)到达终点(3,7)012
2021-11-13 18:25:51 1452 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人