关于深入浅出强化学习中第二章MDP实例的一点问题

前言:最近刚开始看这本书。先说个无关的,按照书上装gym的时候费了我半天劲,最后我全删了按着openai官网上的教程装的。虽然我是初学者也不太懂,但我感觉有些事儿吧,像这种新东西,尤其是技术实现方面,可能两三年前的书上写的都有些过时。作者本人都说成稿的时候就又多了好多大事儿。所以估计也许后面还会从这个书中找出一些更新的问题吧。

正文:
第二章这个实例作者给出了自己的github库

https://github.com/gxnk/reinforcement-learning-code/blob/master/%E7%AC%AC%E4%B8%80%E8%AE%B2%20%20gym%20%E5%AD%A6%E4%B9%A0%E5%8F%8A%E4%BA%8C%E6%AC%A1%E5%BC%80%E5%8F%91/grid_mdp.py

不过在使用的时候有一些需要更新的东西。可能是要配合最新的gym的规定吧。
在render定义部分原文是这么写的。

    def render(self, mode='human', close=False
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值