强化学习自定义环境中，env.step的报错问题

最新推荐文章于 2023-10-19 17:24:57 发布

NathanWu7

最新推荐文章于 2023-10-19 17:24:57 发布

阅读量1.1k

点赞数 1

文章标签： python 开发语言强化学习

本文链接：https://blog.csdn.net/DejaWu33/article/details/129149209

版权

在使用gym对自定义环境进行封装后，在强化学习过程中遇到NotImplementedError。问题出在ActionWrapper类的step方法中的self.action(action)调用。修改为self.env.step(action)后错误消失。尽管stablebaselines3能够兼容自定义环境，但仍然存在action格式不匹配的疑虑。

摘要由CSDN通过智能技术生成

问题描述

搭建自定义环境后，用gym对环境进行了封装，之后在强化学习过程中报了如下错误：

File “/home/nathan/anaconda3/envs/py38/lib/python3.8/site-packages/gym/core.py”, line 349, in step
return self.env.step(self.action(action))
File “/home/nathan/anaconda3/envs/py38/lib/python3.8/site-packages/gym/core.py”, line 353, in action
raise NotImplementedError

此时，env.step的输出经检查没有问题，但gym的源码始终有报错。按照提示进入core.py文件中，如下的代码段

class ActionWrapper(Wrapper):
    def reset(self, **kwargs):
        return self.env.reset(**kwargs)

    def step(self, action):
        return self.env.step(self.action(action))

    @abstractmethod
    def action(self, action):
        raise NotImplementedError

    @abstractmethod
    def reverse_action(self, action):
        raise NotImplementedError