Linux下显卡掉卡,报错提示: rm_init_adapter failed, device minor number 7 Failed to copy vbios to system memory

环境说明:
Centos7 +Nvidia T4显卡
问题现象:
运行一段时间后,显卡掉卡,需要重新安装驱动解决。并且日志中报错:

Apr 9 12:03:32  kernel: NVRM: GPU 0000:b2:00.0: rm_init_adapter failed,
device minor number 7
Apr 9 12:03:48  kernel: NVRM: GPU 0000:14:00.0: Failed to copy vbios to
system memory.
Apr 9 12:03:48  kernel: NVRM: GPU 0000:14:00.0: RmInitAdapter failed!
(0x30:0xffff:755)
Apr 9 12:03:48  kernel: NVRM: GPU 0000:14:00.0: rm_init_adapter failed,
device minor number 0
Apr 9 12:03:48  kernel: NVRM: GPU 0000:15:00.0: Failed to copy vbios to
system memory.
Apr 9 12:03:48  kernel: NVRM: GPU 0000:15:00.0: RmInitAdapter failed!
(0x30:0xffff:755)
Apr 9 12:03:48  kernel: NVRM: GPU 0000:15:00.0: rm_init_adapter failed,
device minor number 1

问题解决:
显卡使用时会加载驱动,未使用时会卸载显卡驱动,驱动循环加载导致系统bug,出现掉卡,宕机等情况。所以需要把显卡驱动持久化,保持加载状态。

显卡持久化介绍:
启用持久性模式后,即使没有活动的客户端 (such as X11 or nvidia-smi),NVIDIA 驱动程序也会保持加载状态。这样可以最大程度地减少与运行依赖的应用程序 (例如 CUDA 程序) 相关的驱动程序加载延迟。适用于所有支持 CUDA 的产品。仅 Linux。

Persistence-M (Persistence Mode)
persistence mode 持续模式默认关闭。persistence mode 能够让 GPU 更快响应任务,待机功耗增加。关闭 persistence mode 同样能够启动任务。

启动命令:

nvidia-smi -pm 1

启动之前:
在这里插入图片描述

启动之后:
在这里插入图片描述

参考链接:
https://www.freesion.com/article/4201198085/

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值