linux cuda 10.1卸载不干净,从零开始Ubuntu18.10安装CUDA10.1心得,及中间遇到的问题...

本文档记录了在Ubuntu18.10上安装CUDA10.1的过程,包括检查系统环境、解决内核版本问题、通过deb包安装CUDA,以及设置环境变量。在安装过程中遇到的坑点是内核版本不符合CUDA要求,通过删除旧内核并使用4.18.0-10-generic版本解决问题。最后验证CUDA安装成功。
摘要由CSDN通过智能技术生成

本来安装的是Ubuntu16.04+CUDA9.0结果后来要给linux kernel降级,系统给整崩溃了

重新安装索性安装了Ubuntu18.10,现在只有CUDA10.1支持

安装完全参考官方:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html

1、部分检查过程,主要判断是否支持cuda,按照官方要求Ubuntu 18.10,支持kernel4.18.0和GCC8.2.0:

检查显卡

lspci | grep -i nvidia

258874302540

检查系统,

uname -m && cat /etc/*release

258874302540

检查gcc版本,我的没有安装过,直接安装的,默认8.2.0

gcc --version

检查内核版本

uname -r

这里是第一个坑爹的地方,因为CUDA对于linux的kernel要求比较严格,我检查出来的版本4.18.0-17-generic,我以为按照要求是符合的4.18.0的安装要求的,结果安装过程中还是出现了坑爹的kernel不支持,于是我看到系统还有另外一个4.18.0-10-generic,(这个可以进入/boot查看)于是直接删除了17版本的kernel(sudo apt-get remove linux-headers-4.18.0-17-generic linux-image-4.18.0-17-generic

),重新启动采用了10版本的kernel。

2、安装CUDA,这里推荐deb安装

(系统提示了两种安装方式,一种是deb安装方式,一种是runfile安装方式,runfile尝试n次未果,怀疑是SecureBoot相关,但是没有找到关闭方法)

1、下载dep

2、进入下载地址,安装deb

sudo dpkg -i cuda-repo-ubuntu1810-10-1-local-10.1.105-418.39_1.0-1_amd64.deb

安装完成的时候会提示没有安装好key之类的,按照提示安装即可

sudo apt-key add /var/cuda-repo-10-1-local-10.1.105-418.39/7fa2af80.pub

sudo apt-get update

sudo apt-get install cuda-10-1

安装cuda10.1且不更新

这样就开始安装了,安装过程中提示了SecureBoot的密码设置,其他就确认好了

3、添加环境变量

export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/NsightCompute-2019.1${PATH:+:${PATH}}

4、重启

reboot

终端输入 nvidia-smi不提示错误能正确现实一些显卡信息就没有问题了

258874302540

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值