微软发布的LQ-Net的环境要求:
tensorflow >= 1.3.0 (本文选择tensorflow-gpu 1.3.0 对应cuda 8 cuDNN 6)
numpy <= 1.16.2
Python bindings for OpenCV
tensorpack(本文选择0.8.3)
1. 安装cuda/cuDNN
1.1 cuda
1.1.1 查看Linux内核版本
命令:cat /proc/version
得到版本是redhat
命令:cat /etc/redhat-release
得到发布版本是7
1.1.2 从官网根据系统内核版本下载cuda安装包
https://developer.nvidia.com/cuda-toolkit-archive
推荐下载runfile(后缀为.run),比较稳定
1.1.3 安装cuda
命令:sh your_cuda_version.run
使用服务器的推荐把cuda安装到自己的用户路径,然后被问到是否要添加symbolic link到/usr/local/cuda时选择否,之后再自己添加软连接。因为使用服务器不要更改系统配置,更改自己的用户配置就可以了
命令:vim ~/.bashrc(更改用户配置),将以下内容添加进去
export PATH=/your_cuda_path/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/your_cuda_path/cuda-8.0/lib64:$LD_LIBRARY_PATH
然后source ~/.bashrc
1.1.4 查看是否安装成功
命令:nvcc -V
如果显示cuda版本就说明安装成功了
1.2 cudnn
1.2.1 下载cudnn的文件
https://developer.nvidia.com/rdp/cudnn-archive
选择版本6
1.2.2 解压下载的文件,会看到一个名为cuda的文件夹,在当前目录打开终端,执行以下命令
cp cuda/include/cudnn.h /your_cuda_path/include/
cp cuda/lib64/libcudnn* /your_cuda_path/lib64/
chmod a+r /your_cuda_path/include/cudnn.h
chmod a+r /your_cuda_path/lib64/libcudnn*
2. 安装指定版本tensorpack
考虑到tensorflow发布的时间,我打算安装2018年5月21日发布的0.8.5版本
命令:pip install tensorpack==0.8.5
3. 安装tensorflow/numpy/opencv
都可以直接用conda命令
conda install tensorflow-gpu = 1.3.0
conda install numpy = 1.16.2
conda install opencv