OpenAI gym入门
安装
使用pip安装gym:
pip install gym
运行 CartPole 的环境来验证安装成功:
import gym
env = gym.make('CartPole-v0') # 环境导入
env.reset()
for _ in range(1000):
env.render()
env.step(env.action_space.sample()) # 随便动一动~~~
增强学习基本原理
agent:智能体,也就是机器人,你的代码本身。
environment:环境,也就是游戏本身,openai gym提供了多款游戏,也就是提供了多个环境。
action:行动,比如玩超级玛丽,向上向下等动作。
state:状态,每次智能体做出行动,环境会相应地做出反应,返回一个状态和奖励。
reward:奖励:根据游戏规则的得分。智能体不知道怎么才能得分,它通过不断地尝试来理解游戏规则,比如它在这个状态做出向上的动作,得分,那么下一次它处于这个环境状态,就倾向于做出向上的动作。
版权声明:转载必须注明本文转自 East196 的博客:http://blog.csdn.net/east196