【Gym】CartPole-v0实验不显示CartPole（倒立摆）

最新推荐文章于 2023-12-04 12:16:25 发布

梦逸清尘

最新推荐文章于 2023-12-04 12:16:25 发布

阅读量5.6k

点赞数 2

分类专栏：强化学习文章标签：机器学习

本文链接：https://blog.csdn.net/WUDIxi/article/details/104550270

版权

强化学习专栏收录该内容

5 篇文章 2 订阅

订阅专栏

环境

系统：Ubuntu19.10

gym：0.15.7

问题

在运行下列示例后：

import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
    env.render()
    env.step(env.action_space.sample())
env.close()

画面上没有CartPole（倒立摆），只有一个白板。

分析原因

上面的代码本身没有问题，但是由于倒立摆是在通过随机采样确定动作，所以很容易就达到 terminal state，从而完成一次eposide。此时，为了开始下一个episode的学习，需要调用env.reset() 重新进行初始化，否则画面上就是一直显示白板。

问题解决

换用如下代码：

import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
    env.render()
    observation, reward, done, info = env.step(env.action_space.sample())
    if done:
        env.reset()
env.close()

保证画面中始终有的CartPole（即CartPole一直在学习中），如图：

在这里插入图片描述

参考

[1] https://github.com/openai/gym/issues/1161

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

梦逸清尘

关注关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
12
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

[环境] OpenAI gym经典控制环境CartPole-v0 介绍

Explore_OuO的博客

04-13

2178

[环境]CartPole-v0 关于此环境的介绍下面三篇就已经足够了，尤其是最后一篇gym GitHub的官方wiki。 OpenAI Gym: the CartPole-v0 environment OpenAI Gym 经典控制环境介绍–CartPole（倒立摆）_思绪无限的博客-CSDN博客_cartpole openai/gym ...

【gym环境】基于迭代算法CartPole-v1倒立摆控制测试例程Pycharm代码仿真与实现

liaoge666的博客

10-18

1743

其实就一行，调用函数。# 程序从这里开始执行print(get_best_result("hill_climbing")) # 调用爬山算法寻优并输出结果于是我们的小车自己就可以寻找最优解，以达到最大的移动次数。

12 条评论您还未登录，请先登录后发表或查看评论

Cartpole-V0没有倒立摆图像

weixin_52850451的博客

10-05

288

解决Cartpole-V0没有倒立摆图像

运行gym库中的倒立摆动画窗口不不显示

u012441413的专栏

11-11

2248

单智能体深度强化学习，尝试跑通第一个例程。

gym库中CartPole-v0环境代码详解

qq_44858605的博客

10-28

771

代码源码在gym\envs\classic_control\cartpole中。当agent完成任务或任务失败后将环境重置为初始状态，以便进行新一轮训练。接受agent的动作、计算下一时刻状态和奖励、检查任务是否已完成。针对源码的详细解释都备注在下方代码块具体程序里。随机数生成器，以便在实验中获得可重复的结果。用于可视化环境状态，一般直接调用就行。

强化学习笔记（一）基于openAI gym CartPole-V0实现

zhangxiaofan的博客

04-14

1万+

强化学习笔记学习笔记（一）基于openAI gym CartPole-V0实现一、基础定义一、基于openAI gym CartPole-V0实例学习1、游戏背景2、代码实现2.1 测试CartPole环境中随机action的表现，作为baseline2.2 构建策略网络2.3 运行结果2.4 总结一、基础定义强化学习是机器学习的一个分支，主要用来解决时序决策问题。他可以在复杂的、不确定...

OpenAI Gym 经典控制环境介绍——CartPole（倒立摆）

最新发布

wq6qeg88的博客

12-04

915

状态是四维的： (位置x，x加速度, 偏移角度theta, 角加速度)位置加速度范围：【-3.4, 3.4】*10^38。该环境的、有两个action : 0 和 1。位置范围：【-4.8, 4.8】小车的位置，就一条x轴。位置—》位置的加速度。角度—》角度的加速度。

windows10安装gym环境后运行atari-py失败，但是atari-py已经安装，运行env=gym.make(‘Pong-v0‘)失败

salmonwilliam的博客

07-04

2468

分三步：第一步：先卸载atari-py。pip uninstall atari-py 第二步：再重新安装这个。pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py 第三步：pip install gym 原文链接：https://blog.csdn.net/ScienceVip/article/details/105097833 ...

测试gym的cartPole 出错后的更改

insid1out的博客

01-12

5770

gym 版本0.26.2框架下的CartPole-v0运行报错的问题

Deep Q-Learning算法解决Cartpole(倒立摆)游戏

CaptainChen的博客

08-11

2233

倒立摆Cartpole-v1 简介 倒立摆为一个小车和一个杆通过轴连接，杆在初始时稍有偏离垂直线，在重力作用下会倒下，游戏目的是通过左右控制小车（施加左右的力）来避免杆的倒下。 API 获取初始状态 env = gym.make("CartPole-v1") state = env.reset() state为一个包含4个元素的list，分别表示小车位置，小车速度，杆的角度，杆的角速度，具体范围如下 Type: Box(4) Num Observation Min

jupyter中显示gym图

qq_29427541的博客

03-11

1787

import matplotlib.pyplot as plt %matplotlib inline from IPython import display #可视化函数： def show_state(env, step=0, info=""): plt.figure(3) plt.clf() plt.imshow(env.render(mode='rgb_array')) plt.title("Step: %d %s" % (step, info))

gym入门

weixin_49897963的博客

03-12

3858

gym入门 gym简介 gym是一个用于开发和比较强化学习算法的工具箱。它对代理（agent）的结构没有任何假设，并且与任何数值计算库(如TensorFlow或Theano)兼容。 gym库是一个测试问题的集合，即环境。你可以用它来制定你的强化学习算法。这些环境有一个共享的接口，允许您编写通用的算法。 gym安装在cmd中输入： pip install gym 环境下面是一个让某些东西运行的最小示例。这将为1000个时间步运行一个 CartPole-v0 环境的实例，并在每个步骤中呈现环境。你应该会看

强化学习（三） - Gym库介绍和使用，Markov决策程序实例，动态规划决策实例

Stan_Fu的博客

08-16

1万+

Gym学习（1）基本的环境搭建与参数含义

qq_47997583的博客

01-14

6800

1.Gym是什么我们为什么要用gym呢？因为gym中封装了很多强化学习的环境，我们在入门或者研究DRL时可以轻视调用gym中写好的环境，帮助我们快速完成任务。 OpenAI Gym 是一个环境仿真库，里面包含了很多现有的环境。针对不同的场景，我们可以选择不同的环境，主要有两类环境一类是离散的，一类是连续的。 2.Gym怎么安装安装的话很容易，在终端中输入以下命令即可 pip install gym 在使用过程中可以会报错缺少其他包，比如pyglet等。此时直接pip安装就行。 3.Gym的经典代码

Pycharm中无法使用matplotlib绘制出动画效果

weixin_41654782的博客

11-10

1954

使用 matplotlib 所绘制的图表无法用于动画效果animation。于是需要把内嵌 plots 单独形成一个窗口：修改步骤如下：输入 Python Scientific 将红框中的 Show plots in toolwindow勾选取消：此时窗口分离出来可以显示预先设定好的动画效果 ...