1. 机器配置
机器是DELL precision 5820,显卡是GTX1080
(安装之前记得先进入bios 把boot secure disable掉 )
系统安装可以参考ubuntu 14 (16.04一样的)
2、NVIDIA显卡安装
NVIDIA 根据显卡型号下载显卡驱动,记得不要下载最新的版本,下载390的任意一个小版本均可(我刚开始下了410+cuda10+cudnn7.4,发现tensorflow1.12并不支持,如果安装了410的显卡,则需要先卸载,这个在下面会说到)。
1).先卸载以前的显卡驱动(如果没有装过,则直接跳过)
sudo apt-get --purge remove nvidia*
这里会输出一些信息,会提示你一些依赖没装,不用慌,这个没关系。
2)打开 blacklist 添加下面几行(一定要进行这一步)
sudo vim /etc/modprobe.d/blacklist.conf
添加:
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
验证一下:
lsmod | grep nouveau
如果没有任何输出,就表明没有问题
3) stop lightdm 【重要,记得一定要先stop,安装完之后记得在start】 lightdm介绍
$ sudo /etc/init.d/lightdm stop
$ sudo init 3
4) 安装显卡驱动
$ chmod a+x NVIDIA-Linux-x86_64-xxx.77.run
$ sudo ./NVIDIA-Linux-x86_64-xxx.77.run -no-x-check -no-nouveau-check -no-opengl-files #这里是关闭x server,nouveau和不下载opengl文件(我也不太明白是个啥)
#之后就会开始安装程序,complete后检查一下
$ nvidia-smi
#出现大框框就ok,之后回到图像界面
$ sudo /etc/init.d/lightdm start
3、cuda9.0安装,记得一定是9.0,不是9.1或者其他版本。下载 runfile(local)版本
然后.run就行。 关键的地方:有一步会让你选择是否安装Graphics Driver for Linux-x86_64:XXXX版本,这个地方必须选择no!否则会覆盖之前的驱动,或者直接报错!!!!
安装完成之后,记得申明环境变量
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
4、验证显卡驱动版本和cuda是否安装成功
$ cat /proc/driver/nvidia/version
$ nvcc -V
输出版本信息则表明没问题了。
5、安装cudnn
cudnn版本必须是7.42 for cuda 9.0 !!!. cudnn
下载的格式是.solitairetheme8 ,运行如下操作解压
sudo cp cudnn-9.0-linux-x64-v7.4.2.24.solitairetheme8 cudnn-9.0-linux-x64-v7.4.2.24.tgz
tar -xvf cudnn-9.0-linux-x64-v7.4.2.24.tgz
然后把cudnn的文件复制到cuda下面 【注意:安装cuda9.0时,会有一个软链,在同一个文件夹下面会有cuda文件夹,记住,是复制到这个文件夹,而不是cuda-9.0这个文件夹】
$ tar -zxvf cudnn-9.0-linux-x64-v7.tgz
cuda/include/cudnn.h
cuda/NVIDIA_SLA_cuDNN_Support.txt
cuda/lib64/libcudnn.so
cuda/lib64/libcudnn.so.7
cuda/lib64/libcudnn.so.7.x.x # 这里版本是你cudnn解压出来的版本
cuda/lib64/libcudnn_static.a
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
添加软链:
$ cd /usr/local/cuda/lib64
$ sudo chmod +r libcudnn.so.7.0.4
$ sudo ln -sf libcudnn.so.7.0.4 libcudnn.so.7
$ sudo ln -sf libcudnn.so.7 libcudnn.so
$ sudo ldconfig
6、安装tensorflow-gpu
pip install tensorflow-gpu==1.12,安装好了即可
参考文献:
https://blog.csdn.net/weixin_41864878/article/details/79621210