nvidia-smi报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver

输入nvidia-smi显示

NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver

但是torch.cuda.is_available()还能用,这就有些别扭了
出现这个问题一般是由于kernel mod 的 Nvidia driver 的版本没有更新
(不是人为因素)
解决办法:

一,重启机器(如果有足够权限的话,直接重启就能解决,下文跳过)

二,如果权限不够,不能重启的话,那就用命令reload kernel mod

(1). 查看依赖(看看就行)

lsmod | grep -i nvidia

一般出现下面这些显示
在这里插入图片描述
(2). 删除一些模块

sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm 
sudo rmmod nvidia_modeset

没有消息就是好消息
在这里插入图片描述
(3).移除nvidia模块(一般会报错)

sudo rmmod nvidia

在这里插入图片描述

lsmod | grep nvidia

在这里插入图片描述
这里的15就说明有进程使用nvidia了,那么不怕被打的话,可以kill该进程
查看有什么进程占用了

sudo lsof -n -w  /dev/nvidia*

在这里插入图片描述
kill该进程

sudo kill 1709

然后发现nvidia的占用由15变成0,那就是好消息
接下来

sudo rmmod nvidia

没有报错就算成功

(4).最后一步

sudo nvidia-smi

就会出现
在这里插入图片描述
即为成功

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值