openai深度强化学习环境搭建汇总

此博客仅为个人学习时的汇总笔记
ubuntu版本:ubuntu18.04
在ubuntu系统中,白天与晚上的最快源不一定一样, 当感觉update更新速度变慢以后可以考虑在"软件和更新"中换源.
多智能体深度强化学习,一般会用到的包有:
pip install scipy numpy mkl matplotlib tensorflow opencv-contrib-python pandas ray networkx -i https://pypi.tuna.tsinghua.edu.cn/simple
ray[rllib]网站:https://ray.readthedocs.io/en/latest/ openai网站:https://spinningup.openai.com/en/latest/index.html

  1. opencv
    opencv安装时可使用语句pip install opencv-contrib-python, 可以避免cv.imshow报错的情况。

  2. numpy
    为了防止numpy在其他编译器中报错,搭配环境时还需要装mkl, pip安装即可。

  3. pycharm
    在安装pycharm时,出错:Failed to load module “canberra-gtk-module”,执行语句:sudo apt-get install libcanberra-gtk-module。

  4. <
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OpenAI Gym是一个用于开发和比较强化学习算法的开源工具包。它提供了许多标准的环境,供研究人员和开发者用于测试和验证他们的算法。 OpenAI Gym的环境可以分为两类:离散动作空间和连续动作空间。 在离散动作空间中,动作的选择是离散的,比如向左、向右、不动等。这类环境包括经典的游戏,如CartPole和FrozenLake。 CartPole是一个很简单的环境,目标是让杆子保持平衡。智能体可以选择向左或向右施加力量来控制杆子的平衡。 FrozenLake是一个迷宫环境,智能体需要从起点到达目标,避免掉入冰冻的湖中。它有四种动作:向上、向下、向左、向右。 在连续动作空间中,动作的选择是连续的,可以是任意值。这类环境更接近于真实场景,比如自动驾驶和机器人控制。其中一个连续动作空间的环境是MountainCar。 MountainCar是一个小车爬坡的环境,目标是让小车爬到山顶。智能体可以选择施加的力量,力量的取值范围是[-1, 1]。 除了这些环境OpenAI Gym还提供了许多其他的环境供选择,涵盖了各种不同的问题和挑战。比如Atari游戏,如Pong和Breakout,以及一些经典的控制问题,如Acrobot和Pendulum。 总的来说,OpenAI Gym提供了丰富多样的强化学习环境,使研究人员和开发者能够快速开发、测试和评估他们的算法。无论是离散动作空间还是连续动作空间,都能够找到适合自己需求的环境

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值