本篇教程来自我在n台服务器+工作站+台式电脑上安装驱动的实践经验。会持续更新。
TODO:添加CUDA的安装
方法一
推荐,要是不行的话,再尝试方法二
使用ubuntu自带的”软件和更新“(英文叫Software & Updates)中“附加驱动”,安装nvidia驱动
如果没有nvidia驱动 或者 驱动太老,可以用如下命令添加ppa源
sudo add-apt-repository ppa:graphics-drivers/ppa
不太确定的事:如果主板开了secure boot,推荐安装 open kernel版本的驱动(ChatGPT4说是用了DKMS,会随着ubuntu内核自动更新驱动???)
NOTE:如果按照此方法安装完成驱动,重启后,没有网络也没有网卡,可能是安装驱动的时候更新了内核 但又 没安装完整,具体参考我的这篇博客
方法二
强烈建议,阅读完全文后再上手实操!!!
以下操作默认使用sudo
权限
-
卸载Nvidia残余文件
如果系统是新装的,还没有安装过任何nvidia的东西,可以跳过这一步直接到第1步。
如果电脑已经安装过nvidia的驱动了,推荐清理一下已经存在的nvidia文件/usr/bin/nvidia-uninstall # 这个最好运行一下 apt remove --purge *nvidia* # 注意:可能会删除cuda等软件包,输入y之前最好确认一下
-
禁用Nouveau的驱动
在/etc/modprobe.d/blacklist.conf
最后添加如下代码:
(用来禁用nouveau第三方驱动,之后也不需要改回来)blacklist nouveau options nouveau modeset=0
然后执行
update-initramfs -u
重启后,执行以下代码,若没有显示则禁用成功
lsmod | grep nouveau
如果遇到这个问题 (perl: warning: Falling back to a fallback locale (“en_US.UTF-8”))[]
apt install locales-all
-
检测NVIDIA显卡型号:
已知自己显卡型号最好,否则在命令行有三种方法
#方法一:使用ubuntu-drivers-common这个软件` apt install ubuntu-drivers-common ubuntu-drivers devices #方法二 lshw -numeric -C display //最好用sudo #方法三 lspci -vnn | grep VGA
也可以用软件AIDA64,这个软件可以看电脑的所有配置信息。
然后下载官方驱动(我比较喜欢最新的版本)。推荐下载英文版的驱动,防止中文乱码。例如
wget http://us.download.nvidia.com/XFree86/Linux-x86_64/410.93/NVIDIA-Linux-x86_64-410.93.run
-
【可选】关闭secure boot:
到电脑的BIOS里关闭“安全启动”的选项。如果不关的话,在后面安装驱动的时候会多一些操作(我会在前面加上“【secure boot】”的标识符表示多出来的操作) -
关闭图形界面:
如果系统已经有图形界面(比如ubuntu desctop),需要关闭一下图形界面。首先,使用快捷键
Ctrl
+Alt
+F1
(F1
不行的话,就换成F2
、F3
…)关切换到命令行界面,然后sudo权限运行命令# 如果是gnome桌面环境,执行 service gdm3 stop # 如果是xfce桌面环境,执行 service lightdm stop # 如果提示Failed to stop lightdm.service: Unit lightdm.service not loaded,可以不用管它,继续
PS:也可以先不运行这个命令,等后面安装驱动的时候报错了(如下图),再执行上面那个命令。
-
安装驱动
启动驱动安装程序(.run)的方法有两种,我更喜欢第二种
# 方法一 chmod +x NVIDIA-Linux-x86_64-410.93.run ./NVIDIA-Linux-x86_64-410.93.run # 方法二 bash NVIDIA-Linux-x86_64-410.93.run
启动安装程序,可以加参数(安装驱动前可能需要先安装gcc和make)。不过,我从来都不加任何参数
我在各种教程里面看到的参数有: (只做搬运)
--no-opengl-files
:表示只安装驱动文件,不安装OpenGL文件。这个参数不可省略,否则会- 导致登陆界面死循环,英语一般称为”login loop”或者”stuck in login”。
--no-x-check
:表示安装驱动时不检查X服务。如果没有这个参数,可能会出现“X-Server needs to be disabled before installing the drivers”的错误。然而我也没有用
--no-nouveau-check
:表示安装驱动时不检查nouveau,非必需。
-Z, --disable-nouveau
:禁用nouveau。此参数非必需,因为之前已经手动禁用了nouveau。
-A
:查看更多高级选项。安装过程中遇到的选择如下: 可能顺序不一样
-
大概是说“预检查”啥的不通过,我都是直接continue,目前没遇到过什么问题
-
如果报什么kernel not install之类的错误,请检查ubuntu内核是否安装完整(比如我有一次就是因为没有安装linux-modules-extra-xxxx-generic)
-
【secure boot】生成秘钥,必须选择Sign the kernel module
-
【secure boot】如果之前已经生成过一次了,可以选择用旧的还是新的,我一般都选generate a new key pair
-
【secure boot】上一步选择新的话,会问你要不要删除旧的。我一般都删了,反正留着没用
-
【secure boot】生成好后类似如下的内容
-
【secure boot】将生成秘钥到内核中注册一下,这里必须选择Install signed kernel module
-
DKMS说是可以更新内核后,驱动一起跟着更新,但是我好像都没成功过,就都选的No(后面会禁止内核更新的)。这个链接里说开启secure boot后开启DKMS会导致无法进入系统
-
有时候会问你要不要安装32位的库,我一般都选择安装(为啥不装嘞,除非空间不够吧)。下图是运气不好,装不上32位的库
-
选择是否要使用nvidia的x config文件替换原来的。我都是把linux中的x理解成是图形界面。看个人喜好要不要替换吧,我一般都选No
-
安装完成后,显示类似如下
-
【secure boot】密钥到内核的信任列表
mokutil --import /usr/share/nvidia/nvida*.der # 然后会提示你设置新密码,需要输入两遍
-
重启,命令是
reboot
-
【secure boot】重启后会自动进入一个蓝色的界面,按任意键,然后根据下图中的选项选择,输入前面
mokutil
命令的密码后重启,进入系统使用命令nvidia-smi
查看是否安装成功
如果忘了按任意键导致无法不能进入下面的界面的话,可以再次进入ubuntu系统再次运行上面的mokutil命令然后重启。(问ChatGPU说也可以在bios中找到secure boot的菜单然后进入,但是我没有尝试过)
-
-
【可选】禁用内核更新:
我理解的安装显卡驱动的过程,会将你安装的显卡驱动跟当前使用的内核进行绑定。如果后续更新内核并重启系统,之前安装的显卡驱动就会识别不到导致无法进入图形界面,需要通过到命令行界面or以save mode启动系统,然后重装显卡驱动
所以为了省事,我都直接禁止更新内核:apt-mark hold linux-image-generic linux-headers-generic
-
若遇到关于kernal的Error,应该是驱动版本和系统内核版本不匹配(图后面有机会补上吧)。
方法一:下载更新版本(or更旧,一般都是更新吧)的驱动。推荐这个,因为我都成功了。
方法二:更改内核的版本。具体应该切换到什么版本的内核,可以参考其他已经成功安装了显卡驱动的电脑的内核版本。查看当前使用的内核
uname -r
,查看grub版本grub-install -V
,切换内核可以参考这个博客
参考文献:
How to install Nvidia drivers and cuda-10.0 for RTX 2080 Ti GPU on Ubuntu-16.04/18.04
Linux secure boot(安全启动)时添加Nvidia显卡驱动