ps:训练模型时xgb的GPU不支持了,报系统错误。一顿神操作,nvidia-smi突然不能用了,(手动狗头)查看原因。。。尼玛有两个版本nvidia-driver互相冲突,不知道为嘛它自己就给更新了嘛。。驱动报废,GPU也用不了,模型训练CPU不给力,心塞。那就驱动卸载,卸不干净,新的也装不上,凉凉。。
Markdown编辑贴上图比现实怎么搞。??
在我考虑把GPU环境弄进docker里怎么操作的时候发现神预言blog,完美解决我的问题。
奉上链接:https://blog.csdn.net/physuleo/article/details/97493900
我没他那么复杂的套路,思路就一个,卸载残留、安装驱动两步。
1、卸载
通常对旧的环境看一遍心中有数
查看 CUDA 版本
cat /usr/local/cuda/version.txt
查看 CUDNN 版本:
cat /usr/local