前言
实验室新到的服务器,原装windows service 2012。同学后改安装了Ubuntu。但是使用Ubuntu系统后风扇声音过大,放在实验室里影响正常工作(小地方没有多余屋子放设备,吐槽吐槽!!!)。
网上搜了一下,应该是换过系统以后没有nvidia驱动,导致风扇持续高速工作。因此,需要重新安装nvidia驱动。在安装过程中遇到了各种坑,这里记录分享一下,以供回顾学习。
本文环境:
- Ubuntu 16
- nvidia Tesla T4
下载对应的驱动
1.安装nvidia驱动
参考csdn中的文章,禁用驱动 [~~~简简单单照着做~~~~]
(1)屏蔽nouveau驱动
用gedit打开
$sudo gedit /etc/modprobe.d/blacklist.conf
在最后加入下面几行语句,保存退出
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
或者在文件后面增加如下内容
blacklist nouveau
options nouveau modeset=0
更新文件
$sudo update-initramfs -u
reboot重启系统,输入下面命令,没有任何输入即为禁用成功
lsmod | grep nouveau
(2)安装驱动
先按Ctrl+Alt+F1,关闭图形界面
$sudo service lightdm stop
在进入到.run文件目录中,安装驱动
$cd /home/xxx/Nvidia //进入下载的.run文件目录中
$sudo chmod a+x NVIDIA-Linux-x86_64-xxx.run //修改权限
$sudo ./NVIDIA-Linux-x86_64-xxx.run -no-x-check -no-nouveau-check -no-opengl-files //执行安装
最后一行命令要加入选项。
遇到的问题→→→→→→→→
在第一次安装中没有-no-opengl-files,安装完成后系统陷入登录界面和/dev/sda5:clean,****files,*****blocks 始终无法进入系统的循环当中。
分别尝试Ctrl+Alt+F3进入tty以及重新reboot选择 advanced options for Ubuntu → recovery mode→root 进入命令行的方式
输入以下代码进行卸载操作,但是都不能正常卸载
$sudo apt-get --purge remove nvidia*
$sudo apt autoremove
最后nvidia贴心的在命令中存在nvidia-uninstall 才可以正常卸载驱动
安装过程中遇到的提示
a)he distribution-provided pre-install script failed! Are you sure you want
to continue?
选择 continue 继续。
b)Would you like to register the kernel module souces with DKMS? This
will allow DKMS to automatically build a new module, if you install a different
kernel later?
选择 no 继续
c)Would you like to run the nvidia-xconfigutility to automatically update
your x configuration so that the NVIDIA x driver will be used when you restart x?
Any pre-existing x confile will be backed up. 选择 yes 继续
(3)完成安装与验证
$sudo service lightdm start //启动图形界面
或者Ctrl+Alt+F7回到图形界面即可
$ nvidia-smi
出现显卡信息则证明安装完成
本文参考了csdn中的许多文章,也遇到了自己发生的意外状况。仅做记录以供参考!!!