多显卡服务器安装显卡驱动导致重启黑屏踩坑(已解决)

一些没用的背景描述(非问题解决部分可跳过):

购买的某大牌塔式服务器,刚用不到三个月(好吧因为懒其实也没咋用),系统莫名其妙死机,去检查了服务器发现有块硬盘闪黄灯,因为我是装了三块硬盘其中一块做冗余。但是不太明白怎么回事就直接按电源键强制重启了服务器,后来我才明白服务器不能直接按电源键强制重启不然会损坏文件甚至硬件QAQ...重启无果,我联系了服务器厂商,商家来说是硬盘的问题有块硬盘坏了换个新的就好了(好在是免费),结果他过来给我换了新的还是不行。在服务器主机开机按钮下面的ID指示灯亮黄色,就说明系统有bug。我就问换硬盘的师傅结果他说他也不会...无奈我只能联系商家说换了硬盘还是有问题干脆重装一下系统吧,因为当时系统是买的时候让商家定制好的。

然后就等来了给我装服务器的老哥(这哥们居然比我还小一岁我不由得心生佩服),来了之后嘎嘎就给我装上了当前的ubuntu18.04,但是开机后ID灯好像还是亮黄色但是感觉没啥影响了,我应该也没问老哥为啥还是黄灯。后来系统开机之后我很开心就没再考虑这个问题了,后来打电话问才知道电源线少插了一根(双电源接入,牛不牛)。故事到这里,题主的驱动安装苦逼路由此展开...

基本情况与问题描述:

服务器配置:

2张A100,一张提高分辨率用显卡(GF119[GeForce GT 705]),530-8i PCIe,8T 3.5硬盘三块,4口千兆,8*64GB DDR4
补:提高分辨率用的显卡是从其他主机上拆下来的,后面是导致显卡驱动一直装不好的问题根源...
系统:ubuntu 18.04 Linux


问题:

题主搞深度学习,需要先装显卡显卡驱动,才能配后面的CUDA+anaconda环境,
1.从ubuntu自带的软件更新-附加驱动-选择最高版本的driver(注意不带server)安装——重启后黑屏

2.命令行直接装-重启——黑屏

方法:输入

ubuntu-drivers devices

会列出一堆driver,这个时候选择最高版本的nvidia-driver-xxx即可,输入

sudo apt-get install nvidia-driver-xxx

等待安装完毕,重启

3.NVIDIA官网下载本服务器显卡对应的驱动,题主在这里下载的是.run文件,按照配置过程装完,输入nvidia-smi可以看到安装成功,但是重启后黑屏

这里的具体步骤可参考

链接:https://blog.csdn.net/huiyoooo/article/details/128015155

但是这种办法

尝试了三种办法的题主此时已经快要黑化了,特别是第三种都已经可以打开终端查到安装的驱动,于是题主开始反思安装失败的原因,三种方法都安装过不同版本的驱动,但无一例外都黑屏,这说明并不一定是驱动版本的问题,于是题主开始对黑屏进行检查

解决措施

每次安装完,默认重启后的黑屏如下

按ctrl+alt+F2(F1-F6都可以试试,不同电脑快捷键不一样)进入tty模式

输入账号密码后,进入如下界面

输入reboot重启,等待开机过程狂按 shift(切记一定要狂!),进入高级选项,选择recovery模式,root,如果是根据方法一和方法二安装的驱动,输入命令

sudo apt-get remove nvidia*

重启即可正常进入。如果是按照方法三安装的,则需要按照这个方法恢复进入系统

本文链接:ubuntu20.04禁用nouveau后黑屏的解决办法_ubuntu20.04关闭nouveau-CSDN博客

但是,这么做,无一例外,安装的驱动全部被卸载的干干净净,也就是所做的一切都前功尽弃,有什么办法能不卸载还能进入呢?

题主自习回忆安装的过程,本服务器是有多张显卡,其中的提高分辨率用显卡(GF119[GeForce GT 705])是从其他机器拔下来直接装在这个服务器上,而这台服务器是题主实现让商家打包配置好的,那么问题很有可能出现在这里,也就是说这张显卡可能需要其他版本的驱动,和服务器本身的显卡驱动不一致,导致安装的驱动不兼容

于是题主就一顿操作把这张显卡给拆下来

拆下之后,再次重装驱动,果不其然,成功进入系统的,但这个时候分辨率不仅不高,而且整个系统变得奇卡务必,甚至移动鼠标都困难,而且,系统莫名其妙的卡在了这个界面

乍一看没什么问题,但是点击用户,输入密码后,系统再次回到这个界面——无限月读???

但是细心的题主发现这里有个设置按钮,点击后出现了三个选项,分别是ubuntu for wayland ,gnome ,gnome xxx(想不起来了)选择ubuntu for wayland,意外的进入了主界面

但是这个时候系统依然是巨卡无比,虽然驱动是装好了,但是分辨率低还卡,要怎么解决呢?既然我刚刚拆了一块提高分辨率的显卡,那把这块显卡再装上不就好了?于是到这里,天真的题主就以为自己历经千辛万苦终于解决了问题,等到满心期待的把这块显卡装回去——再次进入黑屏模式......

但是题主并没有放弃,就如同打不死的小强,虽然重启后依然黑屏,但是进入tty模式后,依然可以通过命令来控制系统,那么题主的骚操作就来了,如果在这里输入nvidia-smi是能查到驱动版本的,先输入reboot重启,等待开机过程狂按 shift,进入高级选项,选择recovery模式

题主这里有两个版本的linux和recovery模式,分析了一下应该是装了两个版本的内核,但是经过试验无论选择哪个最终进入的都是同一个界面,所以不影响。选择第一个5.4.0-150-generic (recovery mode),点击resume,神奇的一幕发生了——服务器进入了主界面!!!

但是进入后界面分辨率变得特别低,于是我打开了设置-设别-显式,发现这里是识别为未知的display。什么情况??我就装了一个驱动而已怎么就未知了??

题主尝试了用xrandr命令修改分辨率,但是报错Failed to get size of gamma for output default,而且xrandr相关的一系列命令都无法使用。

但是题主并没有放弃,找到了这个办法,

原文链接:ubuntu安装后分辨率只有一个选项_vmware ubuntu16.04 只有一个分辨率-CSDN博客

打开:/etc/default/grub文档后修改分辨率,重启,重启还是要狂按shift进入recovery模式再点击resume才能进入系统,这个时候,系统的界面恢复了1920*1080!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值