一. 下载驱动包
笔者以安装Cuda 11.2作为安装示例,先去官网下载相应安装包到本地备用:
CUDA Toolkit 11.2 Downloads | NVIDIA Developer
放置路径如:/home/zxy/cuda_11.2.0_460.27.04_linux.run
wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run
二. 卸载旧驱动
1. 按Ctrl + Alt + F2 进入终端界面(退出gnome界面)
2. 关闭后台图形界面, 这一步是为了防止gnome进程仍使用旧驱动导致卸载失败。
sudo service lightdm stop
3. 卸载显卡驱动 (其实只卸载了驱动快捷方式)
sudo /usr/bin/nvidia-uninstall
4. 进/usr/local/lib,找到cuda-xx.xx一一运行uninstall。这一步彻底卸载了所有旧驱动。
5. 删除依赖cuda的其他package
sudo apt-get --purge remove nvidia*
sudo apt-get --purge remove "*cublas*" "cuda*"
sudo apt-get --purge remove "*nvidia*"
sudo apt autoremove
6. 重启机器
sudo reboot
三. 安装驱动
1. 进入login界面直接Ctrl + Alt + F2,进入终端
2. 确认当前gcc版本是否为5.0以上,低版本安装显卡驱动会失败。
# 检查默认GCC版本 是否为 5.*
gcc -v
# 检查默认G++版本 是否为 5.*
g++ -v
3. 若2确认不在5.0以上,按以下命令切换版本
# 切换gcc版本
sudo update-alternatives --config gcc
# 切换g++到5.*
sudo update-alternatives --config g++
4. 依旧关闭gnome桌面
sudo service lightdm stop
5. 运行安装包
sudo /home/zxy/cuda_11.2.0_460.27.04_linux.run --no-opengl_libs
注意--no-opengl_libs,防止与已有libOpenGL.so冲突
6. 修改环境变量(非常重要!!!)
sudo vi ~/.bashrc
在bashrc中加入:
export PATH=/usr/local/cuda-11.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64:$LD_LIBRARY_PATH
7. 重启机器
sudo reboot
四. 验证安装成功
通过nvidia-smi查看当前cuda版本