centos中nvidia-smi报错NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.

文章讲述了在CentOS7系统中,已安装GPU驱动的Docker容器重启后出现错误的情况,原因是系统默认的nouveau驱动未禁用。作者提供了禁用nouveau、备份重建镜像及重启系统等步骤来解决问题,最终成功恢复了GPU功能和容器运行。
摘要由CSDN通过智能技术生成

问题描述

centos7系统中,之前已经正确安装显卡驱动,并且可以在docker容器中使用GPU。退出并停止容器,一段时间后(就几个小时)重新启动容器时报错(错误信息已经忘记了,好像有容器错误和nvidia-smi-cli错误),无法进入容器。执行nvidia-smi时报错:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

原因分析:

centos系统自带的nouveau没有禁用


解决方案:

1、查看是否禁用nouveau

lsmod | grep nouveau

如果输出 nouveau信息则表示没有禁用。

2、打开blacklist.nf文件,并按字母i进入编辑模式

sudo vim /lib/modprobe.d/dist-blacklist.conf 

在blacklist.conf 文件最后两行中添加下面两句,然后按Esc退出编辑模式,输入“:wq”回车表示保存并退出文件

blacklist nouveau
options nouveau modeset=0

3、备份和重建镜像(不清楚什么意思,但网上别人都是这么做的)

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)

4、重启centos

reboot

成功后进入系统中(可以再执行一次lsmod | grep nouveau看是否成功禁用),不出意外的话再次执行nvidia-smi就可以正常显示显卡信息了。再次执行启动容器命令docker start 容器id,结果启动成功,后继也可以正常进入容器了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>