服务器卡机之后强制重启出现的问题。
原因及拟解决方法:
plan1:
原因: 可能为NVIDIA显卡问题。
拟解决方法:
- Run
mount -o rw,remount /
to mount the drive in Read-Write mode. - Run
sudo apt-get purge nvidia-*
to purge the NVIDIA driver. - You may also need to purge xserver-xorg and reinstall it, which will require you to enable networking in Recovery.(
apt-get purge xserver-xorg
) reboot
重启一下试试。
还是报相同的错误。而且进入tty模式不停闪烁。- Edit
/etc/default/grub
as root, edit the GRUB_CMDLINE_LINUX_DEFAULT line to include it. For example, if you have “splash” listed there already, you’d change it to this Code: 禁用nouveau驱动
GRUB_CMDLINE_LINUX_DEFAULT="splash nouveau.modeset=0"
reboot
重启,然鹅并没有什么用,仿佛啥也没干过。
那就再把NVIDIA安装回去……sudo apt-get install nvidia-367
参考:
https://askubuntu.com/questions/826622/booting-problem-ubuntu-gnome-16-04-01-lts
https://ubuntuforums.org/showthread.php?t=2337135
plan2:
原因:gdm3的问题。
拟解决方法:
进入tty模式,并执行sudo apt-get install slim
出现蓝色选择框选择slim。
reboot
重启.
重启错误改变为 /dev/sda1 ** :clean, **/*** files,***/*** blocks
使用以下命令:
- ctrl +alt+ f2 进入tty的终端模式
- sudo apt-get purge nvidia* (更新驱动) ps 这边怎么感觉想卸载驱动捏emm
- 重启
reboot
参考:https://blog.csdn.net/Jatham/article/details/83864294
重启后显示:The System is running in low-graphics mode
参考:https://zhuanlan.zhihu.com/p/36087073
这类报警提示绝大部分是跟显卡驱动更新导致的系统不兼容有关,因此主要针对你所使用的显卡驱动进行检测:(本GPU服务器所用Nvidia Titan显卡)
① 检测是否是nvidia显卡驱动问题:
进入root用户,输入
root@amax:~# nvidia-smi
- 继续显示:nvidia-smi command not found ,我觉得我的耐心也是真好啊…
sudo apt purge nvidia-*
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt install nvidia-381
(这一步我不知道是不是安装这个版本就用了下面一条命令替换)
由于不知道安装哪个版本的驱动就直接使用
sudo ubuntu-drivers autoinstall
再次nvidia-smi
返回:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
则说明是显卡驱动更新导致系统不兼容的问题。
若结果输出如下结果,则表明显卡驱动正常:
±----------------------------------------------------------------------------+
| NVIDIA-SMI 384.98 Driver Version: 384.98 |
|-------------------------------±---------------------±---------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|=++==============|
| 0 TITAN Xp Off | 00000000:02:00.0 Off | N/A |
| 23% 33C P0 61W / 250W | 0MiB / 12188MiB | 0% Default |
±------------------------------±---------------------±---------------------+
| 1 TITAN Xp Off | 00000000:82:00.0 Off | N/A |
| 23% 24C P0 59W / 250W | 0MiB / 12189MiB | 0% Default |
±------------------------------±---------------------±---------------------+
±----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
±----------------------------------------------------------------------------+
继续往下走 ,使用nvidia-uninstall
发现又是命令不存在……好吧
换一个方法:参考了以下链接,进入修复模式进行操作。
http://archive.3zso.com/archives/ubuntu14.04-running-in-low-graphics.html
重启……得……彻底黑屏了……
- 更新驱动的时候突然发现一直存在的问题就是报错为
E: Sub-process /usr/bin/dpkg returned an error code (1)
解决办法如下:
- $
sudo mv /var/lib/dpkg/info /var/lib/dpkg/info_old
//现将info文件夹更名 - $
sudo mkdir /var/lib/dpkg/info
//再新建一个新的info文件夹 - $
sudo apt-get update
, - $
apt-get -f install
//不用解释了吧 - $
sudo mv /var/lib/dpkg/info/* /var/lib/dpkg/info_old
//执行完上一步操作后会在新的info文件夹下生成一些文件,现将这些文件全部移到info_old文件夹下 - $
sudo rm -rf /var/lib/dpkg/info
//把自己新建的info文件夹删掉 - $
sudo mv /var/lib/dpkg/info_old /var/lib/dpkg/info
//把以前的info文件夹重新改回名字
到此问题顺利解决
参考:http://www.cnblogs.com/jary-wang/archive/2013/05/28/3103829.html
强烈怀疑第一种方法行不通是因为当时没有注意到执行命令的时候出现E: Sub-process /usr/bin/dpkg returned an error code (1),下次可以一试。