【已解决】NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 的报错

问题描述

基于ubuntu16.04,本人在更换一次系统下载源后,误操作进行了内核升级。
执行以下查看cuda命令:

nvidia-smi

出现如下提示:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. 
Make sure that the latest NVIDIA driver is installed and running.

打开系统进行训练,发现tensorflow-GPU还可以正常使用,说明我的GPU驱动还完好不用重新进行驱动安装,CUDA没有问题。这说明是nvidia的查看指令出现了问题。

问题原因

ubuntu的内核版本升级后造成的问题。
在ubuntu升级内核组件后,会优先使用ubuntu内核版本高的版本,ubuntu会修改默认开机启动的内核版本(用最新的)。而最新的内核版本和原来的ubuntu其他组件起了冲突。无法连接nvidia驱动了。(你可以这样理解)

NVIDIA驱动是在低版本的时候安装,由于系统更新,内核版本升级导致NVIDIA无法应用在高内核版本。所以,说明是内核版本的问题,选择低版本的内核即可。

查看设备现有的内核

从ubuntu高级选项进入:
Alt
发现有两个系统内核(这里可以手动进入某一版本内核,确认以下哪个版本需要在后续的步骤里设置为默认内核版本),本人需要使用旧版本4.4.0-197。在这里插入图片描述

设置过程

(1) 设置
进入文件

sudo gedit /etc/default/grub

将GRUB_DEFAULT设为:

#GRUB_DEFAULT=0
GRUB_DEFAULT="1> 3"

使用 ‘>’ 符号来指定有一个子菜单(注意符号 > 和数字 2 之间有空格,所以需要双引号)。 在这种情况下,我在主菜单(即图1)中选择第二个选项(索引1),在子菜单(即图2)中选择第四个选项(索引3)。注意双引号要用英文的""。
具体参数,一定要根据自己电脑按以上逻辑修改
保存后退出。

(2) 更新
一旦对/etc/default/grub进行了更改,请保存并运行以下命令来更新GRUB配置文件(必须,否则不生效),输入如下命令:

sudo update-grub

(3)重新启动
现在应该默认启动旧的内核版本。

进入ubuntu,再次执行命令nvidia-smi发现又可以正常使用了。问题解决。

转载自:
https://www.pudn.com/news/6228ccf49ddf223e1ad10384.html

  • 6
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值