强化学习 — mujoco、mujoco_py、gym 和 baselines的环境配置

最新推荐文章于 2024-08-13 17:55:56 发布

Hansry

最新推荐文章于 2024-08-13 17:55:56 发布

阅读量6.3k

点赞数 2

分类专栏： Reinforcement Learning 文章标签： mujoco mujoco_py pym

本文链接：https://blog.csdn.net/Hansry/article/details/80998720

版权

本文详细介绍了在Ubuntu 16.04上配置强化学习环境的过程，包括安装mujoco、mujoco_py、gym和baselines。内容涵盖MuJoCo的下载与授权，环境变量设置，mujoco_py的安装，OpenAI Gym的安装及使用，以及baselines库的安装与HER算法的应用。

摘要由CSDN通过智能技术生成

和其它的机器学习方向一样，强化学习（Reinforcement Learning）也有一些经典的实验场景，像Mountain-Car，Cart-Pole等。由于近年来深度强化学习（Deep Reinforcement Learning）的兴起，各种新的更复杂的实验场景也在不断涌现。于是出现了OpenAI Gym，MuJoCo，rllab, DeepMind Lab, TORCS, PySC2等一系列优秀的平台。

博主环境
Ubuntu16.04
Anaconda2
python 3.６（建议重新在anaconda中创建新的环境，以下操作均在conda创建环境下配置）
tensorflow-gpu 1.4.1 （baseline 最低要求1.4.1）
CUDA 8.0 (CUDA的安装可参考https://blog.csdn.net/Hansry/article/details/81008210)
Cudnn 6.0

1.安装mujoco

MuJoCo（Multi-Joint dynamics with Contact）是一个物理模拟器，可以用于机器人控制优化等研究。
1.准备工作
在官网上下载 mjpro150 linux ，同时点击Licence下载许可证，需要full name email address computer id 等信息，其中根据使用平台下载 getid_linux（可执行文件） 获取 computer id, 步骤如下：

$ chmod a+x getid_linux (给予执行权限)
$ ./getid_linux

输出结果类似于 LINUX_A1EHAO_Q8BPHTIM10F05D0S3TB3293
这里写图片描述
点击submint 后，从输入的邮箱中下载证书mjkey.txt

2.环境配置
2.1 创建隐藏文件夹并将 mjpro150_linux 拷贝到 mujoco 文件夹中

mkdir ~/.mujoco    
cp mjpro150_linux.zip ~/.mujoco
cd ~/.mujoco
unzip mjpro150_linux.zip

2.2 将证书mjkey.txt拷贝到创建的隐藏文件夹中

cp mjkey.txt ~/.mujoco  
cp mjkey.txt ~/.mujoco/mjpro150/bin

2.3.添加环境变量, 打开～/.bashrc 文件,将以下命令添加进去

export LD_LIBRARY_PATH=~/.mujoco/mjpro150/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}

3.运行结果

cd ~/.mujoco/mjpro150/bin
./simulate ../model/humanoid.xml

2.安装mujoco_py

首先现在官网上下载安装　mujoco_py源码, 注意的是在这里安装的时候可能会缺很多包，但是提示什么装什么就行了。

最低0.47元/天解锁文章

Hansry

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录