OpenAI Gym介绍
最近在学习强化学习,在师兄的推荐下,自学了一款用于研发和比较强化学习算法的工具包——OpenAI Gym,它支持训练智能体(agent)做任何事——从行走到玩Pong或围棋之类的游戏都在范围中。
OpenAI Gym 是一个用于开发和比较RL 算法的工具包,与其他的数值计算库兼容,如tensorflow 或者theano 库。现在主要支持的是python 语言,以后将支持其他语言。官方提供的gym文档。
1.OpenAI Gym组成
Openai gym 包含2 部:
- gym 开源
包含一个测试问题集,每个问题成为环境(environment),可以用于自己的强化学习算法开发,这些环境有共享的接口,允许用户设计通用的
算法,例如:Atari、CartPole等。 - OpenAI Gym 服务
提供一个站点和api ,允许用户对他们训练的算法进行性能比较。
2.强化学习与OpenAI Gym
强化学习(reinforcement learning,RL)是机器学习的一个分支,考虑的是做出一系列的决策。它假定有一个智能体(agent)存在于环境中。在每一步中,智能体