windows下配置OpenAI-gym&baselines

OpenAI Gym website
Gym is a toolkit for developing and comparing reinforcement learning algorithms. It supports teaching agents everything from walking to playing games like Pong or Pinball.
OpenAI Baseline github
OpenAI Baselines is a set of high-quality implementations of reinforcement learning algorithms.

1 安装anaconda&C++编译器

使用Conda的目的是使用虚拟环境,C++编译器可以直接安装Visual Studio 2019。

2 安装Gym

使用 anaconda powershell promopt 来输入:

conda create -n <env-name> python=3.6创建虚拟环境

conda activate <env-name>激活环境

(可选)下载git

conda install git
(可选)如果你需要保存训练的图像,还需要下载ffmpeg包:

conda install -c conda-forge ffmpeg

pip install gym安装gym

或从源码编译:

git clone https://github.com/openai/gym.git
cd gym
pip install -e .xx

源码下载位置为promot当前路径

编译完成后使用

python examples/agents/random_agent.py测试,将会出现经典的 cart-pole 的场景

3 安装Baseline

先安装tensorflow

pip install tensorflow==1.14pip install tensorflow-gpu==1.14

在baseline GitHub页面下载解压到目标文件夹

或用git命令下载

git clone https://github.com/openai/baselines.git
cd baselines
pip install -e .

运行编译成功后,在baselines目录下运行一个DQN算法跑cartpole的例子:

python baselines/deepq/experiments/train_cartpole.py

若报错ImportError: Could not find 'cudart64_100.dll'. TensorFlow requires that this DLL be installed in a directory that is named in your %PATH% environment variable. Download and install CUDA 10.0 from this URL: https://developer.nvidia.com/cuda-90-download-archive可以参考[TensorFlow] windows同时安装cuda10.0和cuda10.1

将会用DQN训练agent 100ksteps, 当训练完成后,你可以运行:

python baselines/deepq/experiments/enjoy_cartpole.py

来观看训练结果

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
OpenAI Gym是一个用于开发和比较强化学习算法的开源工具包。它提供了许多经典的强化学习环境,让研究者能够更轻松地实验和测试自己的算法。 OpenAI Gym包含了一系列模拟环境,可以在这些环境训练强化学习算法。这些环境包括了各种各样的问题,例如棋盘游戏、控制机器人或车辆等场景。这些问题复杂多样,要求智能体在环境进行观察、决策和行动。 OpenAI Gym的设计使得使用者能够方便地编写、测试和比较各种不同的强化学习算法。用户可以在该工具包选择合适的环境,并使用内置的API进行训练和测试。此外,用户还可以通过插入自定义代码来扩展现有环境或创建全新的环境。 OpenAI Gym还提供了一种称为“gym spaces”的概念。这是一种用于描述观察空间和动作空间的通用接口。用户只需定义环境的观察空间和动作空间的特征,就可以使用这些通用接口来处理不同类型的环境。 通过使用OpenAI Gym,研究者可以在一个统一的框架下进行强化学习算法的开发和评估。这使得算法的比较更加公平和准确。同时,OpenAI Gym的开源性质也促进了算法共享和交流,推动了强化学习领域的发展。 总之,OpenAI Gym是一个强大的工具包,为研究者提供了广泛的强化学习环境和便利的开发、测试以及比较算法的功能。它的开源性质和通用接口设计使得研究者能够更加高效地进行算法的开发和创新。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值