gym学习
文章平均质量分 82
小帅吖
无
展开
-
Gym学习(2)自定义注册Gym环境
一个Gym环境包含智能体可与之交互的必须的功能。一般包含4个函数(方法):init:初始化环境类step:输入action,输出包含4个项的list:the next state, the reward of the current state, done, info.reset:重置state和环境的其他变量render:显示实时的视频所有gym环境都包含在pip包中,并遵循以下结构其中各部分的代码如下:gym-foo/setup.pyfrom setuptools i.原创 2022-01-15 12:07:11 · 4400 阅读 · 0 评论 -
Gym学习(3)创建Pybullet的Gym环境
OpenAI Gym是强化学习领域的事实标准。研究员使用Gym来与Gym中的基准比较他们的算法。Gym暴露通用的接口,方便开发。两个重要的设计决定造就了这样的通用接口:RL的两个核心的概念是agent和environment。Gym只提供了environment的抽象接口,agent没有,理由是可以创造出很复杂的agent。在一个特定环境的RL算法的性能可以从两个方面来衡量:(1) 最终的表现 (2) 学习需要的时间1.Pybullet安装Pybullet的安装十分简单,直接pip安装即可p.原创 2022-01-15 10:09:32 · 3086 阅读 · 1 评论 -
Gym学习(1)基本的环境搭建与参数含义
1.Gym是什么我们为什么要用gym呢?因为gym中封装了很多强化学习的环境,我们在入门或者研究DRL时可以轻视调用gym中写好的环境,帮助我们快速完成任务。OpenAI Gym 是一个环境仿真库,里面包含了很多现有的环境。针对不同的场景,我们可以选择不同的环境,主要有两类环境一类是离散的,一类是连续的。2.Gym怎么安装安装的话很容易,在终端中输入以下命令即可pip install gym在使用过程中可以会报错缺少其他包,比如pyglet等。此时直接pip安装就行。3.Gym的经典代码原创 2022-01-14 10:28:19 · 6898 阅读 · 4 评论