1、非root用户下安装cuda9.0和cudnn7.0.5
与tensorflow1.5.0适配的是cuda9.0和cudnn7.0.5,服务器非root用户参考https://blog.csdn.net/weixin_41278720/article/details/81255265安装相应版本。
2、安装Anaconda
主要参考https://blog.csdn.net/hgdwdtt/article/details/78633232
- 首先从清华镜像网站上下载合适的源文件,比如下载Anaconda3-5.0.1-Linux-x86_64.sh
- 将下载的源文件通过FileZilla上传到服务器个人目录下,比如为/home/zhang
- 通过xshell连接到服务器终端,运行bash /home/zhang/Anaconda3-5.0.1-Linux-x86_64.sh,然后一直yes、一直enter,安装过程中会提示设置安装位置。
验证anaconda是否安装成功:
python
>>>import numpy #查看是否能够运行,numpy为anaconda内置python库。
3、安装tensorflow
3.1 首先创建tesorflow环境
可以起名为tf1.5或者tensorflow1.5等等,怎么方便怎么来。这一步一定要做!!!千万不能忘了!
conda create -n tensorflow1.5 python=3.6
此处python=3.6表示python的版本。
3.2 激活tensorflow环境
conda activate tensorflow1.5
经过这步后,将会进入tensorflow1.5环境下,终端显示的目录前面将会有个(tensorflow1.5),后面安装tensorflow或者其他package都需要进入环境。
3.3 安装GPU版本的tensorflow
pip install tensorflow-gpu==1.5.0
3.4 验证是否安装成功
python #启动python环境
# 验证TensorFlow是否安装成功
>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print sess.run(hello)
Hello, TensorFlow! # 恭喜!安装成功!
>>> sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
# 输出里有 GPU的名称,显存等信息,表示tensorflow可以使用GPU了
注:可以通过conda remove -n tensorflow1.5 --all删除不想要的环境。
3.5 安装后续其他需要的package
在tensorflow1.5环境中,可以通过conda install xxx或者pip install pillow==5.2.0安装opencv-python、scikit-image等依赖包。
4、安装pytorch
与安装tensorflow的步骤类似,参考https://blog.csdn.net/amateur_hy/article/details/90716411
- 创建虚拟环境
conda create -n pytorch0.4 python=3.5
- 进入虚拟环境
conda activate pytorch0.4
- 安装pytorch
去pytorch官网https://pytorch.org/,根据系统配置选择合适的版本,按照官网给出的命令,完成安装。
对于pytorch0.4版本,运行:
conda install pytorch=0.4.1 cuda90 -c pytorch
- 安装torchvision
conda install torchvision
在pytorch0.4环境下,同样可以用conda install xxx或者pip install xxx安装其他依赖项。
对于pytorch1.0或者其他版本,只需要在pytorch官网上选择对应版本的指令,其他操作都类似。