OpenAI gym入门

最新推荐文章于 2024-07-10 10:46:05 发布

AI原吾

最新推荐文章于 2024-07-10 10:46:05 发布

阅读量5.1k

点赞数

本文链接：https://blog.csdn.net/east196/article/details/78856002

版权

使用pip安装gym：

pip install gym

运行 CartPole 的环境来验证安装成功：

import gym
env = gym.make('CartPole-v0') # 环境导入
env.reset()
for _ in range(1000):
    env.render()
env.step(env.action_space.sample()) # 随便动一动~~~

增强学习原理图

agent：智能体，也就是机器人，你的代码本身。
environment：环境，也就是游戏本身，openai gym提供了多款游戏，也就是提供了多个环境。
action：行动，比如玩超级玛丽，向上向下等动作。
state：状态，每次智能体做出行动，环境会相应地做出反应，返回一个状态和奖励。
reward：奖励：根据游戏规则的得分。智能体不知道怎么才能得分，它通过不断地尝试来理解游戏规则，比如它在这个状态做出向上的动作，得分，那么下一次它处于这个环境状态，就倾向于做出向上的动作。