Ubuntu16.04LTS下搭建强化学习环境gym、tensorflow

1.安装Anaconda。

清华镜像下载anaconda3_4.3.0-linux-x86_64.sh,然后在终端中输入以下命令进行安装:

cd downloads
bash anaconda3_4.3.0-linux-x86_64.sh
2.创建虚拟环境。
//gymlab是自己起的虚拟环境名称 python=x.y指定python版本
conda create --name gymlab python=3.5
3.安装gym。

先重新打开一个终端,然后遵循以下步骤:

//激活虚拟环境
source activate gymlab
sudo apt install git
git clone https://github.com/openai/gym.git
cd gym
pip install -e '.[all]'
pip install --upgrade setuptools
pip install numpy Matplotlib
pip install opencv-python
如果安装无误,那么恭喜你,直接进入下一步,配置环境变量。我在执行上面最后一条命令的时候报错了,内容大致是如下两个:
Failed building wheel for atari-py
Failed building wheel for Box2D-kengz
这时候尝试使用以下方法解决:
sudo apt-get install cmake
sudo apt-get install -y python-numpy python-dev cmake zlib1g-dev libjpeg-dev xvfb libav-tools xorg-dev python-opengl libboost-all-dev libsdl2-dev swig
pip install -e '.[all]'

如果碰到无法安装mujoco-py的错误,使用以下方法解决(挨个试,然后还是没装上,然后我就不管了,去装tensorflow了,结果装完tensorflow之后再执行这些代码,就非常意外的装上了。。。):

sudo apt-get install python3-dev
sudo apt-get install libevent-dev
yum install kernel-devel libxslt-devel libffi-devel python-devel mysql-devel zlib-devel openssl-devel -y

python -m pip install --upgrade --force pip 
pip install setuptools==33.1.1
pip install distribute
sudo apt-get update

python3 -m pip install aiohttp
python3 -m pip install --upgrade pip 
pip3 install -U 'mujoco-py<1.50.2,>=1.50.1' 

git clone https://github.com/openai/mujoco-py  
cd mujoco-py  
pip install -e . --no-cache  

4.安装tensorflow

接上步,执行以下代码即可:

pip install --upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-1.4.1-cp35-cp35m-linux_x86_64.whl

5.配置环境变量。

执行以下命令进入配置文件:

sudo gedit ~/.bashrc
在文件末尾追加如下代码:
//"home/lch/gym"是我的机器中gym路径,大家自行更换
export PYTHONPATH="/home/lch/gym:$PYTHONPATH"
执行source命令使修改生效:
source ~/.bashrc
6.简单测试。
打开一个终端,先激活虚拟环境:
source activate gymlab
输入"python"进入shell界面,输入以下代码:
import gym
import tensorflow
env=gym.make('CartPole-v0')
env.reset()
env.render()
生成下图,说明环境搭建成功。





  • 4
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值