前言:最近刚开始看这本书。先说个无关的,按照书上装gym的时候费了我半天劲,最后我全删了按着openai官网上的教程装的。虽然我是初学者也不太懂,但我感觉有些事儿吧,像这种新东西,尤其是技术实现方面,可能两三年前的书上写的都有些过时。作者本人都说成稿的时候就又多了好多大事儿。所以估计也许后面还会从这个书中找出一些更新的问题吧。
正文:
第二章这个实例作者给出了自己的github库
https://github.com/gxnk/reinforcement-learning-code/blob/master/%E7%AC%AC%E4%B8%80%E8%AE%B2%20%20gym%20%E5%AD%A6%E4%B9%A0%E5%8F%8A%E4%BA%8C%E6%AC%A1%E5%BC%80%E5%8F%91/grid_mdp.py
不过在使用的时候有一些需要更新的东西。可能是要配合最新的gym的规定吧。
在render定义部分原文是这么写的。
def render(self, mode='human', close=False