0、准备工作
(1)查看GPU是否支持CUDA
lspci | grep -i nvidia
(2)查看Linux版本
uname -m && cat /etc/*release
1、nvidia驱动下载
NVIDIA 驱动程序下载 --------自行选择驱动版本号
下载好以后,默认保存在Downloads 下面
(1)先卸载原有N卡驱动
#for case1: original driver installed by apt-get:
sudo apt-get remove --purge nvidia*
#for case2: original driver installed by runfile:
sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-384.59.run --uninstall
(2)禁用nouveau驱动
1.2.1 桌面环境:(2选1)
sudo gedit /etc/modprobe.d/blacklist.conf
1.2.1 远程环境(2选1)(vim使用方法自行查询--保存:wq ):
sudo vim /etc/modprobe.d/blacklist.conf
在文本最后添加:
blacklist nouveau
options nouveau modeset=0
保存后执行:
sudo update-initramfs -u
重启以后,能够查看nouveau有没有运行:
lsmod | grep nouveau # 没输出表明禁用生效
(3)禁用X-Window服务
sudo service lightdm stop #这会关闭图形界面
按Ctrl-Alt+F1进入命令行界面,输入用户名和密码登陆。
(4)命令行安装驱动
1.4.1 cd 到下载目录:
#给驱动run文件赋予执行权限:
sudo chmod +x NVIDIA-Linux-x86_64-384.183.run
#后面的参数很是重要,不可省略:
sudo ./NVIDIA-Linux-x86_64-384.183.run -no-opengl-files
sudo ./NVIDIA-Linux-x86_64-384.183.run -no-opengl-files
(重要的事情说三遍,这里面的-和字母之间没有空格、这里面的-和字母之间没有空格、这里面的‘-’和字母之间没有空格)
后面的选项很重要,很重要!否则后面桌面登入会出现死循环!!!!
1.4.2、 按照提示一路下去,Accept->Yes->默认
1.4.3、很快就安装完毕.输入:
nvidia-smi
查看信息.出现驱动信息说明安装成功
1.4.4 打开X-window :
sudo service lightdm startap
1.4.5 Driver测试:
nvidia-smi #若列出GPU的信息列表,表示驱动安装成功
nvidia-settings #若弹出设置对话框,亦表示驱动安装成功
2、CUDA下载链接:
CUDA Toolkit 9.0 Downloads | NVIDIA Developer
2.1 安装CUDA 到对应下载目录下(默认Downloads):
sudo sh cuda_9.0.176_384.81_linux.run
2.2 开始安装以后,须要阅读说明,可使用Ctrl + C直接阅读完成,或者使用空格键慢慢阅读。下面为安装选项:测试
(是否赞成条款,必须赞成才能继续安装)
accept/decline/quit: accept
(这里不要安装驱动,由于已经安装最新的驱动了,不然可能会安装旧版本的显卡驱动,致使重复登陆的状况)
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: n
Install the CUDA 10.0 Toolkit?(是否安装CUDA 10 ,这里必需要安装)
(y)es/(n)o/(q)uit: y
Enter Toolkit Location(安装路径,使用默认,直接回车就行)
[ default is /usr/local/cuda-10.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?(赞成建立软连接)
(y)es/(n)o/(q)uit: y
Install the CUDA 10.0 Samples?(不用安装测试,自己就有了)
(y)es/(n)o/(q)uit: n
Installing the CUDA Toolkit in /usr/local/cuda-10.0 ...(开始安装)
2.3 配置环境变量
(1)桌面环境:
sudo gedit ~/.bashrc
(2)远程环境:
sudo vim ~/.bashrc
末尾加入
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
2.4 更新
source ~/.bashrc
2.5 验证安装
查看cuda版本code
nvcc -V
CUDA Sample测试:
#编译并测试设备 deviceQuery:
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
make
./deviceQuery
#编译并测试带宽 bandwidthTest:
cd ../bandwidthTest
make
./bandwidthTest
若是这两个测试的最后结果都是Result = PASS,说明CUDA安装成功。
*2.6 CUDA卸载(略过)
在命令行中输入
sudo apt-get remove cuda
sudo apt-get autoclean
sudo apt-get remove cuda*
而后在目录切换到usr/local/下
cd /usr/local/
sudo rm -r cuda-9.0
3、 安装cuDNN7.6.5.32
目的是:安装cuDNN库来加速我们的深度学习算法
下载cuDNN,需要在Nvidia官网注册账号,网址如下:
https://developer.nvidia.com/rdp/cudnn-download
登录后,选择你对应版本的cuDNN,我的是Ubuntu16.04且安装的是CUDA9.0,所以我下载如下三个文件,直接默认存在~/Downloads/目录下。
CUDNN下载链接:
cuDNN Archive | NVIDIA Developer
注意:这三个文件都要下载。
使用如下命令安装:
$ cd ~/Downloads/
$ ls
$ sudo dpkg -i libcudnn7_7.3.1.20-1+cuda9.0_amd64.deb
$ sudo dpkg -i libcudnn7-dev_7.3.1.20-1+cuda9.0_amd64.deb
$ sudo dpkg -i libcudnn7-doc_7.3.1.20-1+cuda9.0_amd64.deb
安装完成
在我们验证cuDNN之前,我们必须首先安装freeimage lilbray作为ministCUDNN示例代码的依赖关系。否则,会有提示要求我们正确设置Freeimage
$ sudo apt-get install libfreeimage3 libfreeimage-dev
使用如下命令验证;
$ cp -r /usr/src/cudnn_samples_v7/ $HOME
$ cd $HOME/cudnn_samples_v7/mnistCUDNN
$ make clean && make
$ ./mnistCUDNN
如果输出如下信息就表示安装cuDNN成功,并且还可以看到你机器上有几个支持cuda的设备
感谢以下博主:
参考资料:
Ubuntu16.04安装CUDA9.0+cuDNN7.3GPU版TensorFlow过程记录_wgllovemother的博客-CSDN博客