前言
最近利用实验室的计算服务器上的GPU进行神经网络模型的训练,但是由于是公共资源,自己没有sudo权限,不能直接通过pip install的方式安装自己想要的包,经过查阅资料发现可以通过在自己的用户根目录下创建一个tensorflow的虚拟环境,在该环境下进行包的安装以及tensorflow的使用等,记录在这里以便以后的查阅。
这里使用CUDA 9.0 + cudnn v7进行环境的配置,这两种资源的安装方式请查阅其他的blog,现在网络上关于CUDA和cudnn安装方式的资源已经十分丰富,所以这里也就不再重复。(其实是因为我们实验室的服务器上已经事先装好了CUDA和cudnn,如果是公共服务器找管理员装一下就好了)值得一提的是对CUDA环境的配置方法,在bash中自己用户的根目录下依次输入以下命令:
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc
执行以上命令之后CUDA环境应该就配置好了,如果不行的话可以输入vim ~/.bashrc,然后手动在该文件末尾加入上面代码行的前两行(去掉开头的export),保存文件后再输入source ~/.bashrc命令完成环境的配置。
Anaconda的安装
本人使用的是Anaconda 3.0进行虚拟环境的配置,首先到Anaconda官网,在https://repo.anaconda.com/archive/下根据自己的系统以及需要的python版本选择合适的包,这里使用的是Anaconda3-4.2.0-Linux-x86_64.sh。将包下载到本地后上传到服务器,然后在bash下移动到包所在的目录,输入:
bash ./Anaconda3-4.2.0-Linux-x86_64.sh
跟随指引完成Anaconda的安装。
虚拟环境的创建和tensorflow-gpu的安装
首先输入以下命令创建tensorflow的虚拟环境:
conda create -n tensorflow python=3.5
这里python版本为3.5的原因是上面安装的conda包默认python版本为3.5,当然如果安装的conda包版本不同可以根据实际情况修改上述python的版本。
等待片刻即可完成虚拟环境的创建,进入虚拟环境需要用到以下命令:
source activate tensorflow
进入tensorflow虚拟环境后输入以下命令安装tensorflow-gpu:
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.10.1
等待片刻tensorflow-gpu便能成功安装到虚拟环境中,以后想使用tensorflow的时候可以先通过前面的命令进入tensorflow虚拟环境然后进行使用,以下是执行上述操作之后对tensorflow是否成功安装的验证:
user@server:~$ source activate tensorflow
(tensorflow) tangruijie@GPUServer3:~$ python
Python 3.5.4 |Continuum Analytics, Inc.| (default, Aug 14 2017, 13:26:58)
[GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import tensorflow
>>>
如果没有报错,说明tensorflow-gpu已经成功安装。