-
问题
一大早跑到实验室,准备调试代码,然后就开始报错!!关键是头一天在这环境下运行还一点问题都没有,一晚上没动它也能出问题!!郁闷( ˇˍˇ )
然后,我就仔细看了一下出现啥问题,大致说什么pytorch的cuda版本问题,我就纳闷了,之前好好的,莫名其妙就出现问题!但是就是这么出现了,能怎么办呢,找原因啦。。。
于是,我就想用nvidia-smi
查看一下我的cuda版本是不是之前的,但是呢,我一点回车,哎,这个直接报错。。。。直接给我来了一句Failed to initialize NVML: Driver/library version mismatch
就跳出了!!!!
现在显卡直接不能用了。。。。这让我更郁闷了,我开始找度娘寻找解决办法,总结如下方法供大家参考,希望能帮我跟我碰到一样问题的小伙伴 -
解决办法
查找度娘,都觉得是NVIDIA 内核驱动版本与系统驱动不一致的问题!
大致有两种方法可以解决,也欢迎大家提供更多方法
- 方法一:(本人自己亲测的)简单粗暴,重启电脑!!没错,你没看错,重启电脑直接解决!这真是本人亲自测试的有效的,这都得益于一篇博客评论区的朋友。
- 方法二:我没有尝试,因为我直接用了方法一就解决了问题,没办法测试了;-) ,写在这供大家参考:
1)输入命令cat /proc/driver/nvidia/version
,查看显卡驱动所使用的内核版本(如,我的当时显示是cuda418.181)
2)输入命令cat /var/log/dpkg.log | grep nvidia
,查看电脑驱动(如,我的当时显示cuda418.197)
3)输入命令sudo dpkg --list | grep nvidia-*
,查看电脑所有驱动(发现我的显卡驱动全部变成cuda418.197,可能是我当时代码运行环境是在cuda418.181下安装的,所有才会出现问题!!)
4)输入命令sudo apt-get purge nvidia*
,卸载电脑驱动
5)依次输入命令sudo add-apt-repository ppa:graphics-drivers
和sudo apt-get update
,把显卡驱动加入ppa(个人软件包文档,仅支持Ubuntu),类似于应用商店
6)输入命令sudo apt-get install nvidia-版本 nvidia-settings nvidia-prime
,重装适合自己nvidia驱动版本
7)输入命令nvidia-smi
,查看解决方案是否生效,至此完成整个步骤
8)为防止再次出现这样的问题,可以禁用当前版本的本地更新,命令:sudo apt-mark hold nvidia-版本
参考博客:https://blog.csdn.net/qq_40200387/article/details/90341107