OpenAI-Gym的初次尝试

最新推荐文章于 2024-03-19 09:35:10 发布

电压酱

最新推荐文章于 2024-03-19 09:35:10 发布

阅读量460

点赞数

分类专栏：人工智能

本文链接：https://blog.csdn.net/weixin_42287898/article/details/84554417

版权

本文介绍了OpenAI Gym，一个用于强化学习算法研发和比较的工具包。内容包括安装Gym，环境（Environments）的reset和render操作，观察（Observations）的类型，以及动作空间（Spaces）的Discrete和Box类型。文章通过示例展示了如何在CartPole-v0环境中进行交互，并强调了done标志在episode结束时的重要性。

摘要由CSDN通过智能技术生成

OpenAI Gym介绍

OpenAI Gym是一款用于研发和比较强化学习算法的工具包，它支持训练智能体（agent）做任何事例如官方案例的车杆游戏和乒乓球游戏

安装Gym

安装gym之前先装好pyhton3.5及以上版本
使用pip安装gym

pip install gym

从github上下载安装gym

git clone https://github.com/openai/gym
cd gym
pip install -e .

环境( Environments )

import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
    env.render()
    env.step(env.action_space.sample()) # take a random action

其中env.reset()重置环境的状态,、env.render()重绘环境的一帧
结果可以看出随机控制算法发散，系统很快失去稳定。

src="http://s3-us-west-2.amazonaws.com/rl-gym-doc/cartpole-no-reset.mp4">