关于深入浅出强化学习中第二章MDP实例的一点问题

最新推荐文章于 2024-08-15 13:20:27 发布

Azorius

最新推荐文章于 2024-08-15 13:20:27 发布

阅读量365

点赞数

分类专栏：强化学习文章标签：强化学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43207798/article/details/112607198

版权

前言：最近刚开始看这本书。先说个无关的，按照书上装gym的时候费了我半天劲，最后我全删了按着openai官网上的教程装的。虽然我是初学者也不太懂，但我感觉有些事儿吧，像这种新东西，尤其是技术实现方面，可能两三年前的书上写的都有些过时。作者本人都说成稿的时候就又多了好多大事儿。所以估计也许后面还会从这个书中找出一些更新的问题吧。

正文：
第二章这个实例作者给出了自己的github库

https://github.com/gxnk/reinforcement-learning-code/blob/master/%E7%AC%AC%E4%B8%80%E8%AE%B2%20%20gym%20%E5%AD%A6%E4%B9%A0%E5%8F%8A%E4%BA%8C%E6%AC%A1%E5%BC%80%E5%8F%91/grid_mdp.py

不过在使用的时候有一些需要更新的东西。可能是要配合最新的gym的规定吧。
在render定义部分原文是这么写的。

    def render(self, mode='human', close=False

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。