重温强化学习之强化学习模拟平台

1、OpenAI Gym

官网:http://gym.openai.com/

OpenAI Gym是一个用户开发和比较强化学习算法的工具包,与其它的数值计算库兼容,如tensorflow

Openai gym 包含两个部分:

   1)gym开源:

       包含一个测试集,每个问题成为一个环境(environment),可以用于自己的强化学习算法开发,环境有共享的接口,允许用户设计通用的算法,例如:Atari、CartPole等

  2)OpenAI Gym服务

      提供一个站点和api,允许用户对他们训练的算法进行性能的比较

OpenAI安装:pip install gym[all]

OpenAI Baselines

它是OpenAI出的一些深度强化学习算法(DQN,PPO,TRPO,DDPG)的实现,基于Tensorflow和OpenAI Gym

源码:https://github.com/openai/baselines

2、MuJoCo

MuJoCo(Multi-Joint dynamics with Contact)是一个模拟的机器人,生物力学,图形和动画等领域的物理引擎

官网:http://www.mujoco.org/index.html

源码:https://github.com/openai/mujoco-py

可以使用源码安装:

  • git clone https://github.com/openai/mujoco-py

  • cd mujoco-py

  • pip install -e. --no-cache

3、rllab

与OpenAI Gym类似,rllab也是一个强化学习算法的框架

官网:https://rllab.readthedocs.io/en/latest/user/installation.html

源码:https://github.com/rll/rllab

与OpenAI Gym的区别在于OpenAI Gym支持更广泛的环境,且提供在线的scoreboard可以用于共享训练结果。

rllab也提供一个基于pygame的可视环境,同时也兼容OpenAI Gym

4、DeepMind Lab

DeepMind Lab是由DeepMind发布的3D迷宫场景的强化学习平台

官网:https://deepmind.com/blog/open-sourcing-deepmind-lab/

论文:https://arxiv.org/pdf/1612.03801.pdf

源码:https://github.com/deepmind/lab

5、TORCS

TORCS(The Open Racing Car Simulator)是一个跨平台的赛车游戏模拟器,也可以作为强化学习的研究平台

官网:http://torcs.sourceforge.net/

gym_torcs是一个TORCS 的强化学习环境,提供类似前面OpenAI Gym的接口

源码:https://github.com/ugo-nama-kun/gym_torcs

 

6、PySC2(StarCraft II)

DeepMind的AlphaGo把围棋搞定之后,业界开始将目光头像即时策略游戏,如StarCraft II(星际争霸II)。DeepMind和Blizzard合作出了个StarCraft II的研究平台,称为PySC2

官网:https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/

论文:https://deepmind.com/documents/110/sc2le.pdf

源码:https://github.com/deepmind/pysc2

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值