目录
一、N卡驱动的安装
1、去NVIDIA官网找到对应自己显卡驱动的文件
example:GeForce GTX 1060 6G
2、根据pytorch对应版本选择显卡驱动版本,一般为向下兼容,下载run文件,如NVIDIA-Linux-x86_64-460.67.run
3、禁用自带的驱动
打开配置文件:
$ sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
禁用nouveau,在文件末尾添加如下内容:
blacklist nouveau
options nouveau modeset=0
更新,并reboot
$ sudo update-initramfs -u
$ sudo reboot
4、命令行界面卸载之前的NVIDIA驱动
快捷键Ctrl+Alt+F1进入命令行界面
卸载之前NVIDIA驱动
$ sudo service lightdm stop
$ sudo apt-get remove --purge nvidia*
5、找到.run文件路径,并进行安装(需要自己对应下载版本)
$ sudo chmod a+x NVIDIA-Linux-x86_64-460.67.run
$ sudo ./NVIDIA-Linux-x86_64-460.67.run -no-x-check -no-nouveau-check -no-opengl-files
6、安装选项(可能不同,google)
if you install a different kernel later?(No)
32-bit compatibility libraries?(No)
Any pre-existing x confile will be backed up.(Yes)
7、挂载N卡驱动,并check是否安装成功,再reboot,完成~
$ modprobe nvidia
$ nvidia-smi
$ sudo reboot
二、CUDA安装
需要使用多个深度学习框架的虚拟环境,故配置anaconda管理,使得环境与包之间不冲突
同时也可以通过变换环境路径来进行选择适合深度学习框架的CUDA,不需要进行其他操作,这一点很方便(对于需要快速切换不同版本的深度学习框架而言)
$ gedit ~/.bashrc
1、去NVIDIA官网找到对应CUDA版本,并下载.run文件
example:ubuntu16.04 CUDA11.0
wget下载文件,或是直接进入该网站即可下载
$ wget http://developer.download.nvidia.com/compute/cuda/11.0.2/local_installers/cuda_11.0.2_450.51.05_linux.run
2、运行.run文件,安装CUDA
$ sudo chmod +x cuda_11.0.2_450.51.05_linux.run
$ sudo sh cuda_11.0.2_450.51.05_linux.run
安装选项
accept EULA?(accept)
[]Driver(将其去掉勾选)
3、添加环境变量激活该版本的CUDA
$ sudo gedit ~/.bashrc
#注释之前的CUDA,添加需要CUDA的path
export PATH="/usr/local/cuda-11.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH"
4、查看CUDA版本,完成~
$ nvcc -V
说明
N卡驱动的版本以及CUDA版本的选择都是需要查看需要的深度学习框架对应的版本,并查表找到一一对应关系,这很决定是否成功配置环境,否则容易出现版本不兼容的错误,这个在安装之前是需要认真考虑的。