Linux-Skills:ubuntu安装nvidia英伟达驱动和cuda
Intro
在管理服务器的时候,英伟达驱动和cuda和容易安装出问题,借此机会总结一下我的试错经验。
测试机器:ubuntu 22.04;
Solution
1. 检查驱动和cuda安装情况:
终端内输入 nvidia-smi
$ nvidia-smi
如果出现如上信息,则是显卡驱动是ok的,其中Cuda Version的意思是最高支持的cuda版本号;
再次终端输入 nvcc -V
查看cuda版本:
$ nvcc -V // 或者 nvcc --version
如下,我的cuda是12.2,满足我安装的nvidia驱动的要求;
2. 上述内容不能通过的话,请严格全面卸载nvidia驱动和cuda,重新安装;
参考https://blog.csdn.net/qq_53937391/article/details/131501801,卸载卸载nvidia驱动和cuda;
之后重新安装;可以在官网上下载配套驱动和cuda手动安装:搜索引擎搜索“英伟达驱动"和“cuda”相关,去==! 官网 !==按照说明进行下载;
在安装驱动和cuda时候,除了去官网手动下,还可以通过apt源:
- 查看支持的驱动:
$ ubuntu-drivers devices
- 直接安装recommend的版本,安装其他版本GG的可能性更大,笔者就尝试了安装其他版本,之后nvidia-smi不能正常输出信息,大G:
按照如上我的信息,对应535版本
sudo apt install nvidia-driver-535
安装完成后nvidia-smi
查看,若正常输出信息,则安装成功,接下载安装cuda;
- 运行
sudo apt install nvidia-cuda-toolkit
$ sudo apt install nvidia-cuda-toolkit
这是apt源的cuda,我安装的时候这个cuda版本是比较老的,是11.5版本,此时我想安装12的cuda的话,直接搜索引擎搜索想要的版本,比如我要安装12.2的cuda:
按照引导安装即可,随后查看 nvcc -V
: