自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 第二节 OpenAI Gym接口概要

Agent和环境之间的共同接口概要该公共接口由“OpenAI Gym”的“Env”类保持。“Env” 类是将强化学习的“环境”封装起来的类。主要的方法和性质如下所示。一:生成环境env = gym.make(id)'''gym.make(id) 说明:生成环境 参数:Id(str类型) 环境ID 返回值:env(Env类型) 环境 环境ID是OpenAI Gym提供的环境的ID,可以在OpenAI Gym网站的Environments中确认 例如,如果是“CartPole”环境

2021-04-12 21:03:25 2582 2

原创 第一节 OpenAI Gym环境命名规则

OpenAI Gym环境命名规则如果环境ID的“v”后面有数字,就代表着当前环境的版本。环境ID有“ram”的时候,根据环境返回的“状态”是Atari游戏中使用的“ram”(Random Access Memory) “随机存取存储器”的内容。当环境ID有“deterministic”时,agent传递给环境的动作会被重复执行4帧,然后返回“状态”。环境ID有“NoFrameskip”的时候,agent传递给环境的动作被执行1帧,然后马上(没有跳过帧) 返回“状态”。默认情况下,在环境ID中不

2021-04-12 20:17:27 242

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除