背景:
本来用gpu用的好好的,有一天系统软件自动更新手贱点了确定,里面包含nvidia字眼,当时看到就感觉有点不妥,仍然点了确定。
恩,直觉真准,但是手快啊!!于是开启了踩坑之路。
报错:
使用gpu版本的tensorflow,运行session时会出现如下问题:
于是乎gpu就不能用了,nvidia-smi也报错说类似版本不匹配的意思。
查看当天的系统更新内容:
可以发现驱动被更新了,但是由错误可以看出来,是和cuda的kernel版本不匹配(看英文是这样猜的,不确定)。
于是决定重装驱动回退到之前的版本。
这里有参考这个博客,有类似的问题:参考博客1
安装驱动:尝试1
首先,删除掉之前的驱动相关
sudo apt-get remove --purge nvidia*
最开始采用的是ppa源安装驱动的方式,但是ppa源一直连接不上,放弃这种方法,
这种方法参考博客: