什么是CartPole
CartPole又叫倒立摆。如下图,小车上放了一根杆,杆会因重力而倒下。我们要通过移动小车保持杆树立,不让其倒下。网页跳转
在实际训练中,发现每次reward上限只有200。
在gym的安装位置在文件gym/envs/init.py 中,限定了最大的步数:max_episode_steps,可以通过修改它来解决问题。
register(
id="CartPole-v0",
entry_point="gym.envs.classic_control:CartPoleEnv",
max_episode_steps=200,
reward_threshold=195.0,
)
register(
id="CartPole-v1",
entry_point="gym.envs.classic_control:CartPoleEnv",
max_episode_steps=500,
reward_threshold=475.0,
)
直接修改对应得参数即可,其他环节也是一样。这里的CartPole-v0和CartPole-v1都是倒立摆的环境,只不过是两个不同版本而已,需要调用哪个版本的倒立摆环境,就改哪个的max_episode_steps。