OpenAI Gym学习

本文介绍了OpenAI Gym,一个用于强化学习算法开发和比较的工具包,支持训练智能体进行各种任务,如游戏。内容包括OpenAI Gym的组成、强化学习与OpenAI Gym的关系以及如何安装和使用。
摘要由CSDN通过智能技术生成

OpenAI Gym介绍

最近在学习强化学习,在师兄的推荐下,自学了一款用于研发和比较强化学习算法的工具包——OpenAI Gym,它支持训练智能体(agent)做任何事——从行走到玩Pong或围棋之类的游戏都在范围中。

OpenAI Gym 是一个用于开发和比较RL 算法的工具包,与其他的数值计算库兼容,如tensorflow 或者theano 库。现在主要支持的是python 语言,以后将支持其他语言。官方提供的gym文档

1.OpenAI Gym组成

Openai gym 包含2 部:

  • gym 开源
    包含一个测试问题集,每个问题成为环境(environment),可以用于自己的强化学习算法开发,这些环境有共享的接口,允许用户设计通用的
    算法,例如:Atari、CartPole等。
  • OpenAI Gym 服务
    提供一个站点和api ,允许用户对他们训练的算法进行性能比较。

2.强化学习与OpenAI Gym

强化学习(reinforcement learning,RL)是机器学习的一个分支,考虑的是做出一系列的决策。它假定有一个智能体(agent)存在于环境中。在每一步中,智能体࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值