UBUNTU NVIDIA gtx1080ti显卡驱动突然不能用一种猜想

最近在Ubuntu16.04下搭了一个caffe+cuda9.0+nvidia-run396.18的框架进行深度学习训练,昨天晚上程序还好好的,今天早晨程序就跑不起来了,调用终端发现nvidia-smi指令无效,提示缺少驱动。可是明明就有驱动啊,经过多次调查,还是没有找出原因。于是没有办法,选择重装驱动。

在装的过程中受尽折磨,这里那里都不合适。除了要注意禁用nouveau之外,还有要注意的几点:

1.从官网上下载run文件后直接放在/home目录下

2.Ctrl+Alt+f1进入指令界面,进行安装时要先关闭lightdm  

3.安装语句:

sudo ./NVIDIA-Linux-x86_64-398.16.run --no-nouveau-check --no-opengl-files

4.reboot一下

再次输入nvidia-smi 出现显卡信息,于是表明安装成功。

————————————————————————————————————————————

在安装过程中,一直出现 unable to load kernel module nvidia.ko 的错误,用run文件一直无法安装成功

我换成sudo apt-get的时候又显示boot空间不足,这使我想到是不是内核升级的原因?我利用

df  -lh

查看挂载点,发现boot使用率竟然达到90%.....好吧,我只分配了200m...

于是我采用下面大神办法清理了boot

清理boot的方法

最后死马当活马医,又用run文件安装一下,竟然可以了,很神奇...

—————————————————————————————————————————————

虽然不清楚驱动安装不成功是否和boot有关,但是我猜驱动突然不能用和内核升级有关,所以朋友们在进行深度学习

训练时可以关闭自动升级,以防造成不必要的麻烦。



展开阅读全文

没有更多推荐了,返回首页