说点人话的强化学习：如何显示当前训练的环境，openai gym不显示画面，env.render()不显示画面，CartPole不显示画面

最新推荐文章于 2025-03-05 13:35:56 发布

动量核心

最新推荐文章于 2025-03-05 13:35:56 发布

阅读量3.9k

点赞数 17

分类专栏：说点人话的强化学习文章标签： python 开发语言人工智能深度学习 pytorch

本文链接：https://blog.csdn.net/weixin_49703503/article/details/129111907

版权

说点人话的强化学习专栏收录该内容

3 篇文章

订阅专栏

在新版gym中，使用`env.render()`直接显示画面的方法不再有效。可以设置`render_mode=human`来显示运行画面，但会影响训练速度。另一种方法是设置`render_mode=rgb_array`，将画面存储为rgb_array，然后通过cv2进行渲染，这样可以在需要时显示特定训练阶段的画面，提高训练效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在早期版本gym中，调用env.render()会直接显示当前画面，但是现在的新版本中这一方法无效。现在有一下几种方法显示当前环境和训练中的画面：

1. render_model = "human"

env = gym.make("CartPole-v1", render_mode = "human")

显示效果：

问题：

该设置下，程序会输出所有运行画面。但是这一步会带来一个问题，因为画面渲染需要时间，导致训练变的非常慢。强化学习的前期是一个一直试错的部分，显然我们并不是每次都想花费时间去观察模型试错，并且多数时候我们想要观察我们想观察的训练阶段。对此我们可以使用下一个方法；

2. render_model = "rgb_array"

env = gym.make("CartPole-v1", render_mode = "rgb_array")

该方法会让env.render()返回一个 rgb_array，这一rgb_array 表示当前step下的环境画面，当我们需要显示的时候可以使用cv2来进行渲染。方法如下：

# RGB 转化为BGR， cv2显示格式为BGR
img = cv2.cvtColor(env.render(), cv2.COLOR_RGB2BGR)

# 显示画面，test为窗口名称
cv2.imshow("test",img)

# 给cv2一定时间完成渲染，否则无法显示
cv2.waitKey(1)

显示效果如下：