强化学习 — mujoco、mujoco_py、gym 和 baselines的环境配置

本文详细介绍了在Ubuntu 16.04上配置强化学习环境的过程,包括安装mujoco、mujoco_py、gym和baselines。内容涵盖MuJoCo的下载与授权,环境变量设置,mujoco_py的安装,OpenAI Gym的安装及使用,以及baselines库的安装与HER算法的应用。
摘要由CSDN通过智能技术生成

和其它的机器学习方向一样,强化学习(Reinforcement Learning)也有一些经典的实验场景,像Mountain-Car,Cart-Pole等。由于近年来深度强化学习(Deep Reinforcement Learning)的兴起,各种新的更复杂的实验场景也在不断涌现。于是出现了OpenAI Gym,MuJoCo,rllab, DeepMind Lab, TORCS, PySC2等一系列优秀的平台。

博主环境
Ubuntu16.04
Anaconda2
python 3.6(建议重新在anaconda中创建新的环境,以下操作均在conda创建环境下配置)
tensorflow-gpu 1.4.1 (baseline 最低要求1.4.1)
CUDA 8.0 (CUDA的安装可参考https://blog.csdn.net/Hansry/article/details/81008210)
Cudnn 6.0

1.安装mujoco

MuJoCo(Multi-Joint dynamics with Contact)是一个物理模拟器,可以用于机器人控制优化等研究。
1.准备工作
官网上下载 mjpro150 linux ,同时点击Licence下载许可证,需要full name email address computer id 等信息,其中根据使用平台下载 getid_linux(可执行文件) 获取 computer id, 步骤如下:

$ chmod a+x getid_linux (给予执行权限)
$ ./getid_linux  

输出结果类似于 LINUX_A1EHAO_Q8BPHTIM10F05D0S3TB3293
这里写图片描述
点击submint 后,从输入的邮箱中下载证书mjkey.txt

2.环境配置
2.1 创建隐藏文件夹并将 mjpro150_linux 拷贝到 mujoco 文件夹中

mkdir ~/.mujoco    
cp mjpro150_linux.zip ~/.mujoco
cd ~/.mujoco
unzip mjpro150_linux.zip

2.2 将证书mjkey.txt拷贝到创建的隐藏文件夹中

cp mjkey.txt ~/.mujoco  
cp mjkey.txt ~/.mujoco/mjpro150/bin

2.3.添加环境变量, 打开~/.bashrc 文件,将以下命令添加进去

export LD_LIBRARY_PATH=~/.mujoco/mjpro150/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}

3.运行结果

cd ~/.mujoco/mjpro150/bin
./simulate ../model/humanoid.xml

2.安装mujoco_py

首先现在官网上下载安装 mujoco_py源码, 注意的是在这里安装的时候可能会缺很多包,但是提示什么装什么就行了。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值