OpenAI gym入门

OpenAI gym入门

安装

使用pip安装gym:

pip install gym

运行 CartPole 的环境来验证安装成功:

import gym
env = gym.make('CartPole-v0') # 环境导入
env.reset()
for _ in range(1000):
    env.render()
env.step(env.action_space.sample()) # 随便动一动~~~

增强学习基本原理

增强学习原理图

  • agent:智能体,也就是机器人,你的代码本身。

  • environment:环境,也就是游戏本身,openai gym提供了多款游戏,也就是提供了多个环境。

  • action:行动,比如玩超级玛丽,向上向下等动作。

  • state:状态,每次智能体做出行动,环境会相应地做出反应,返回一个状态和奖励。

  • reward:奖励:根据游戏规则的得分。智能体不知道怎么才能得分,它通过不断地尝试来理解游戏规则,比如它在这个状态做出向上的动作,得分,那么下一次它处于这个环境状态,就倾向于做出向上的动作。


版权声明:转载必须注明本文转自 East196 的博客:http://blog.csdn.net/east196

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI原吾

你的鼓励是我创作最大的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值