OpenAI Gym 入门与提高（一） Gym环境构建与最简单的RL agent

最新推荐文章于 2024-07-10 10:46:05 发布

算法学习者

最新推荐文章于 2024-07-10 10:46:05 发布

阅读量1.9w

点赞数

分类专栏： RL

RL 专栏收录该内容

37 篇文章 9 订阅

订阅专栏

Openai gym是一个用于开发和比较RL算法的工具包，与其他的数值计算库兼容，如tensorflow或者theano库。现在主要支持的是python语言，以后将支持其他语言。gym文档在https://gym.openai.com/docs。

Openai gym包含2部分：

1、gym开源库：包含一个测试问题集，每个问题成为环境（environment），可以用于自己的RL算法开发。这些环境有共享的接口，允许用户设计通用的算法。其包含了deep mind 使用的Atari游戏测试床。

2、Openai gym服务：提供一个站点和api允许用户对他们训练的算法进行性能比较。

总之，openai gym 是一个RL算法的测试床（testbed）。

在增强学习中有2个基本概念，一个是环境（environment），称为外部世界，另一个为智能体agent（写的算法）。agent发送action至environment，environment返回观察和回报。

gym的核心接口是Env，作为统一的环境接口。Env包含下面几个核心方法：

1、reset(self):重置环境的状态，返回观察。

2、step(self,action):推进一个时间步长，返回observation，reward，done，info

3、render(self,mode=’human’,close=False):重绘环境的一帧。默认模式一般比较友好，如弹出一个窗口。

more…..

了解更多内容请下载下面的pdf文档：

1-20160618-OpenAIGym入门与提高-1Gym环境构建与最简单的RLagent.pdf

算法学习者

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
OpenAI Gym 入门与提高（一） Gym环境构建与最简单的RL agent

Openai gym是一个用于开发和比较RL算法的工具包，与其他的数值计算库兼容，如tensorflow或者theano库。现在主要支持的是python语言，以后将支持其他语言。gym文档在https://gym.openai.com/docs。Openai gym包含2部分：1、gym开源库：包含一个测试问题集，每个问题成为环境（environment），可以用于自己的RL算法开
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。