关于本人最近安装nvidia显卡的总结和一些坑 centos7
1.查看Linux系统是否已经安装了Nvidia驱动
命令行输入:nvidia-smi
进行查看可能出现两种情况://注意中间没有空格
nvidia-smi
情况1: 如果出现如下则表示没有安装驱动
bash: nvidia-smi: command not found...
情况2: 如果输出以下信息,则Linux系统中已经安装了Nvidia驱动。(表示已经有驱动了就不用往下看了)
2.下载Nvidia官方驱动程序
2.1查看自己的显卡型号,下载对应的驱动。命令行输入:lspci | grep NVIDIA
lspci | grep NVIDIA
正常的话输入命令按回车后如果有显卡 如显示一下信息:
坑1: 输入命令后出现错误:
bash: lspci: command not found
解决方法:安装pciutils
包
// 如果是ubuntu用户执行这个代码即可
sudo apt-get install pciutils
// 如果是centos用户执行这个代码 即可
sudo yum install pciutils
2.2然后根据中括号里面的显卡信号去官网找对应的驱动:
官网1:https://www.nvidia.cn/geforce/drivers/
官网2:https://www.nvidia.cn/Download/index.aspx?lang=cn
由于在官网一没有找到A100对应的显卡驱动 本人就去官网2下载了如下图所示: 点击搜索->下载->下载 即可完成,文件以.run结尾
如果windows下载成功之后将文件放在服务器上
3.安装Nvidia驱动程序的准备
(禁用方法1 具体可以参考博客1)禁用nouveau驱动 (至于为什么要禁用他你可简单的理解为不禁用的话安装可能会有问题):
首先输入命令nouveau是否被禁用(默认是没有禁用):
lsmod | grep nouveau
出现上图表示没有禁用, 如果输入成功之后没有任何反应表示已经禁用了 可以跳过这一步
(1)所以开始执行禁用nouveau操作
分别打开如下两个文件(如果没有就创建一个),并在其中输入如下两句,然后保存。
vim基本操作进入要按i进行写文字,写完之后 按ESC
–>:wq!
保存即可
# vim /etc/modprobe.d/nvidia-installer-disable-nouveau.conf
# vim /lib/modprobe.d/nvidia-installer-disable-nouveau.conf
blacklist nouveau
options nouveau modeset=0
(2)重做 initramfs 镜像
这一步需要确保 boot 文件目录的空间足够,否则会失败。建议大于 400 MB
cp /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
rm /boot/initramfs-$(uname -r).img.bak ; 这一步可不执行
(3) 重启
如果之前在图形界面操作,需要改为终端模式,runlevel 改为 3
# systemctl set-default multi-user.target
# init 3
# reboot
(4)预安装组件
# yum install gcc kernel-devel kernel-headers
(5).重启服务器使其生效(如果可以重启的话,因为遇到过不重启没有禁用的情况)
reboot
检查是否成功禁用了nouveau 输入命令
lsmod | grep nouveau
没有显示之前的图片则代表禁用成功
(禁用方法2 具体可以参考博客2):
(1).执行代码:这里是
sudo vim /etc/modprobe.d/blacklist.conf
(2).进入文件中, 点击i插入后, 在文件中最后一行添加:
blacklist nouveau
(3).添加完成后使用 按esc
->:wq!
保存并退出
执行下面命令:(我当时执行这个命令的时候出现了错误没有解决, 我是用方法1禁用成功的)
sudo update-initramfs -u
(4).重启服务器使其生效(如果可以重启的话,因为遇到过不重启没有禁用的情况)
reboot
(5).继续执行下面命令检查是否禁用成功
lsmod | grep nouveau
没有输出则表示禁用成功
4.安装.run程序(这里要先切换到安装文件(.run)的当前目录)
4.1 给第2步下载的驱动程序安装文件增加可执行权限,驱动文件所在目录打开命令行,输入以下命令:
sudo chmod a+x NVIDIA-Linux-****.run //NVIDIA-Linux-****.run 表示你下载的驱动程序安装文件
例如我的是:
sudo chmod a+x NVIDIA-Linux-x86_64-470.103.01.run
4.2 接着命令行输入以下命令进行安装:
sudo bash ./NVIDIA-Linux-*******.run -no-opengl-files //NVIDIA-Linux-*******.run 表示你下载的驱动程序安装文件
例如我的是:
sudo bash ./NVIDIA-Linux-x86_64-470.103.01.run --no-opengl-files
坑2:执行这一句的时候可能会出现:
Verifying archive integrity... Error in check sums 1981929512 2439459451
解决方案: 说明刚刚的下的驱动有问题,删除该文件去官网重新下一次,如果还不行或者换一个cuda版本下一次
4.3 顺利安装(出现如下信息)
Verifying archive integrity... OK
Uncompressing NVIDIA Accelerated Graphics Driver for Linux-x86_64 470.103.01..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
出现如下界面:
许可证 -accept
…
安装 32 位兼容库 -yes
点击ok安装顺利完成
最后执行nvidia-smi
验证是否安装成功
nvidia-smi
芜湖 成功安装 大功告成
如果你还遇到了其他问题,可以参考下面三博客,这个博客是主要通过这三个博客编写和解决的:
参考博客1:https://blog.csdn.net/xueshengke/article/details/78134991
参考博客2:https://blog.csdn.net/qq_44961869/article/details/115945912
参考博客3:https://blog.csdn.net/whynotldch/article/details/100677540