目录
安装显卡后输入 nvidia-smi 就会显示显卡驱动版本信息,若提示
重要:明确操作系统,查询对应的显卡型号,再到nvidia官网驱动下载对应的驱动版本。下方附带有查询显卡型号的网站和nvidia官网驱动下载地。
lspci | grep -i vga 和 lspci | grep -i nvi
可查看是否有显卡信息,如返回有如下信息,就代表系统识别到了显卡,若没有,请检查显卡是否连接正常,主要检查是否有松动,或者断触,电压,金手指等,这些都会影响显卡识别不到,重新断电插拔显卡。
注意:这里查询不到型号信息,还有一种情况是虚拟机,可用下方命令查看是否是虚拟机,返回none就不是虚拟机,kvm就是虚拟机
systemd-detect-virt
如上图可看出这是一张型号为1650的nvidia显卡,若没有具体标识,则会显示英文+数字的型号,需要复制该型号到下方查询显卡型号链接,进行查询。
查询显卡型号:PCI devices
确认好型号后,再到nvidia官网显卡驱动进行下载。(显卡驱动需要选择对应的操作系统)
查询显卡驱动:官方驱动 | NVIDIA
centos系统
- 联网:使用 wget 命令下载显卡驱动
- 无法联网:提前在Windows电脑下载好,再用工具把驱动包传到centos系统里。
- 服务器下载好驱动后,给驱动执行权。chmod +x 驱动包名
1,安装显卡驱动首先得关闭系统自带的核显驱动(重启后生效)
在 /usr/lib/modprobe.d/dist-blacklist.conf 中进行修改和添加两行内容:
将blacklist nvidiafb替换为#blacklist nvidiafb
再添加下方两行命令
blacklist nouveau
options nouveau modeset=0
2,若机器已添加过,则用下方命令查看是否需要重启服务器,如果返回为空即为禁用成功。
lsmod | grep nouveau
安装驱动
./NVIDIA-Linux-x86_64-470.86.run -no-opengl-files -a -s -no-x-check
-no-opengl-files -a -s -no-x-check 可以在不关闭桌面程序的情况下,把显卡安装上。
常见报错
1,若返回报错:The kernel module failed to load, because it was not signed by a key that is trusted by the kernel 内核模块加载失败,得不到内核授权。
检查安全模式是否开启
mokutil --sb-state (SecureBoot enabled关,反之则为开)
需要进BIOS关闭安全启动项 (进BIOS找到Secure Boot选项,改为Disabled)
2,缺少内核文件安装在 内核版本
ls /usr/src/kernels/ 查看是否有内核文件
uname -r 查看当前使用的内核文件,去对比已安装的内核,若不同,则需要重启服务器,开机选择对应的内核启动。
注意:
rpm -qa | grep kernel(查看确认下方三个rpm包(kernel、kernel-headers、kernel-devel)是否缺少),若缺少则需要下载补全。
kernel-3.10.0-957.27.2.el7.x86_64.rpm
kernel-headers-3.10.0-957.27.2.el7.x86_64.rpm
kernel-devel-3.10.0-957.27.2.el7.x86_64.rpm
3,腾讯云服务器是不完整显卡时,需要自行在安装系统页面把显卡驱动安装上去。
4,若返回报错:unable to find the development too 'cc' in you path; please make sure that you have the package 'gcc
解决方法:yum install gcc
5,若返回报错:The nvidia kernel module was not created
可能与安装的系统有关,确认是不是安装的是centos mini版 如果提示找不到内核源码,加上参数:--kernel-source-path=/usr/src/kernels/$(uname -r)/
安装显卡后输入 nvidia-smi 就会显示显卡驱动版本信息,若提示
1,NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver
第一种情况是因为内核的不兼容,需要升级内核,卸载之前安装的显卡驱动,重启服务器选择新内核,重新再安装一遍。
第二种情况是因为显卡驱动需要重启才会生效,即重启服务器后再输入nvidia-smi即可
重装显卡步骤
分两种:
第一种:可以找到驱动包的情况下
./NVIDIA-Linux-x86_64-470.86.run --uninstall
重启服务器后,再次安装显卡驱动
第二种:找不到驱动宝的情况下
cd /usr/bin
sudo nvidia-uninstall
重启服务器后,再次安装显卡驱动
2,提示:No devices were found 找不到设备
解决方法:
1,重装显卡驱动,按照最新的NVIDIA官网进行安装。
2,重新插拔显卡,再重新安装显卡驱动。
以上方法都试过后还是无效,可能是显卡坏了,检查下显卡的风扇是否在转动,同时也要检查下是不是被挖矿了,需要联系厂家进行处理。
centos min系统
- 联网:使用 wget 命令下载显卡驱动
- 无法联网:提前在Windows电脑下载好,再用工具把驱动包传到centos系统里。
- 服务器下载好驱动后,给驱动执行权。chmod +x 驱动包名
1,安装显卡驱动首先得关闭系统自带的核显驱动(重启后生效)
在 /usr/lib/modprobe.d/dist-blacklist.conf 中进行修改和添加两行内容:
将blacklist nvidiafb替换为#blacklist nvidiafb
再添加下方两行命令
blacklist nouveau
options nouveau modeset=0
2,若机器已添加过,则用下方命令查看是否需要重启服务器,如果返回为空即为禁用成功。
lsmod | grep nouveau
安装驱动
需要添加对应的内核信息路径
./NVIDIA-Linux-x86_64-470.86.run --kernel-source-path=/usr/src/kernels/3.10.0-1160.66.1.el7.x86_64 -k $(uname -r) --no-drm
ubuntu系统
- 联网:使用 wget 命令下载显卡驱动
- 无法联网:提前在Windows电脑下载好,再用工具把驱动包传到centos系统里。
- 服务器下载好驱动后,给驱动执行权。chmod +x 驱动包名
1、添加执行权
chmod 666 /etc/modprobe.d/blacklist.conf
2、添加禁用核显模块
vi /etc/modprobe.d/blacklist.conf
blacklist amd76x_edac
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
3,载入
update-initramfs -u
4,安装驱动
./NVIDIA-Linux-x86_64-535.113.01.run -no-opengl-files -a -s -no-x-check
-no-opengl-files -a -s -no-x-check 可以在不关闭桌面程序的情况下,把显卡安装上。
常见报错
若返回报错:unable to find the development too 'cc' in you path; please make sure that you have the package 'gcc
解决方法:yum install gcc