【linux】gpu显卡报错,如何禁坏卡

背景:

gpu服务器的显卡坏了,导致机器重启,需要找出坏卡禁掉。

操作流程:

一、使用dmest -T先查看系统日志,找出报错显卡的id

dmesg -T
[五 5月  5 21:16:09 2023] NVRM: GPU 0000:0b:00.0: RmInitAdapter failed! (0x26:0xffff:1227)
[五 5月  5 21:16:09 2023] NVRM: GPU 0000:0b:00.0: rm_init_adapter failed, device minor number 5
[五 5月  5 21:17:05 2023] NVRM: Xid (PCI:0000:0b:00): 32, pid=0, Channel ID 00000000 intr 80004000
[五 5月  5 21:17:05 2023] NVRM: GPU 0000:0b:00.0: RmInitAdapter failed! (0x26:0xffff:1227)
[五 5月  5 21:17:05 2023] NVRM: GPU 0000:0b:00.0: rm_init_adapter failed, device minor number 5
[五 5月  5 21:18:04 2023] NVRM: Xid (PCI:0000:0b:00): 32, pid=0, Channel ID 00000000 intr 80004000
[五 5月  5 21:18:04 2023] NVRM: GPU 0000:0b:00.0: RmInitAdapter failed! (0x26:0xffff:1227)
[五 5月  5 21:18:04 2023] NVRM: GPU 0000:0b:00.0: rm_init_adapter failed, device minor number 5
[五 5月  5 21:18:08 2023] NVRM: Xid (PCI:0000:0b:00): 32, pid=0, Channel ID 00000000 intr 80004000
[五 5月  5 21:18:08 2023] NVRM: GPU 0000:0b:00.0: RmInitAdapter failed! (0x26:0xffff:1227)
[五 5月  5 21:18:08 2023] NVRM: GPU 0000:0b:00.0: rm_init_adapter failed, device minor number 5

二、找到坏卡对应的id后,使用nvidia-smi命令禁止坏卡。

#禁卡命令:
sudo nvidia-smi drain -p 0000:0b:00.0 -m 1

ps:不行就lspci |grep VGA看所有显卡的bus id,轮流把一半显卡禁掉看能正常运行不。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在安装nvidia显卡驱动时报错可能有多种原因。根据引用\[3\]中提供的信息,错误信息可能是由于以下几种情况导致的: 1. 驱动程序与内核源代码不匹配或配置不正确。这可能是由于使用了错误或配置不正确的内核源代码版本,或者使用了与目标内核构建时使用的gcc版本不同的gcc版本。 2. 存在rivafb/nvidiafb等驱动程序,阻止了NVIDIA内核模块获取NVIDIA图形设备的所有权。 3. 安装的NVIDIA GPU不受此NVIDIA Linux图形驱动程序版本的支持。 为了解决这个问题,可以尝试以下步骤: 1. 从nVidia官方网站下载最新版本的nVidia驱动程序。 2. 以管理员身份打开blacklist模块,并在/etc/modprobe.d/blacklist.conf文件中添加以下内容并保存: blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv 3. 删除之前安装的所有nVidia驱动程序。 4. 重启计算机。 5. 当出现无法加载nVidia驱动程序的错误提示时,选择进入终端选项。 6. 登录并进入下载驱动程序的文件夹。 7. 安装驱动程序:sudo sh NVIDIA-Linux-x86_64-195.36.24-pkg2.run(根据实际下载的驱动程序版本进行替换)。 8. 重启计算机。 这些步骤应该能够帮助您解决在Linux安装nvidia显卡驱动时报错的问题。请注意,确保您下载的驱动程序与您的硬件和操作系统版本兼容。 #### 引用[.reference_title] - *1* *2* [记录Manjaro Linux安装nvidia显卡驱动失败的经历&更新内核出问题如何修复](https://blog.csdn.net/weixin_44220976/article/details/127940616)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [linux英伟达显卡偶尔加载失败,Ubuntu 10.04 安装Nvidia显卡出错解决方法](https://blog.csdn.net/weixin_32002013/article/details/116962369)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值