1 NVIDIA驱动
1.1查看推荐的驱动版本
ubuntu-drivers devices
选择recommend,下载:https://www.nvidia.cn/Download/Find.aspx?lang=cn
将要安装驱动版本,如不匹配ubuntu系统自带gcc g++版本,需要自行升降级。
https://blog.csdn.net/weixin_43177345/article/details/123533420?spm=1001.2014.3001.5501
1.2Nouveau驱动禁用
sudo gedit /etc/modprobe.d/blacklist.conf
或者
sudo vim /etc/modprobe.d/blacklist.conf
在最后两行添加:
blacklist nouveau
options nouveau modeset=0 // 禁用nouveau第三方驱动,之后也不需要改回来
执行
sudo update -initramfs -u // 更新内核
重启reboot后在终端输入如下,没有任何输出表示屏蔽成功
lsmod | grep nouveau
1.3关闭图形界面安装驱动
这种方法安装nvidia驱动需要先停止图形界面
sudo telinit 3
// 之后进入一个新的命令行会话,使用当前的用户名密码登陆
用cd 进入你放nvidia驱动的路径
sudo chmod 777 NVIDIA-Linux-x86_64-4xx.xx.run #给你下载的驱动赋予可执行权限,才可以安装
sudo ./NVIDIA-Linux-x86_64-4xx.xx.run (–no-opengl-files) #安装
期间可能遇到的问题,如下选项:
最后执行
sudo reboot // 重启
1.4验证安装成功
nvidia-smi
2 安装cuda
2.1删除cuda
#1.用 runfile 方式安装的删除方法:
sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
#2. 用 package manager 方式安装的删除方法:
sudo apt-get --purge remove cuda-8.0
sudo apt autoremove sudo apt-get autoclean
# cudnn文件和samples残留在 /usr/local/cuda-8.0/,删除
sudo rm -rf /usr/local/cuda-8.0/
2.2安装cuda
cuda与driver对应版本参考链接:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
cuda与GCC版本对应参考链接:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html
对应nvidia-smi右上角cuda版本去官网下载:https://developer.nvidia.com/cuda-toolkit-archive
选择runfile(local),并使用生成的指令进行下载和安装
$ wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
$sudo sh cuda_11.8.0_520.61.05_linux.run
注意这里空格取消driver选项,再点install。
安装完成后,可能显示如下:
到这里暂时安装失败,去查 var/log/cuda-installer.log显示安装终止,通过~/.bashrc文件中添加如下环境变量,即可解决:
export PATH=/usr/local/cuda-11.x/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.x/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
或者:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
2.3 验证cuda
nvcc -V
3 安装cudnn
3.1 安装cudnn
官网下载:https://developer.nvidia.com/rdp/cudnn-archive
下载好tar压缩包后进行安装
tar -xvf cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive.tar.xz
# 复制cudnn头文件
sudo cp cudnn-linux-x86_64-8.4.1.50_cuda11.x-archive/include/* /usr/local/cuda-11.x/include/
# 复制cudnn的库
sudo cp cudnn-linux-x86_64-8.4.1.50_cuda11.x-archive/lib/* /usr/local/cuda-11.x/lib64/
# 给予权限
sudo chmod +x /usr/local/cuda-11.x/include/cudnn*.h
sudo chmod +x /usr/local/cuda-11.x/lib64/libcudnn*
3.2验证cudnn
cat /usr/local/cuda-11.7/include/cudnn_version.h | grep CUDNN_MAJOR -A 2