NVIDIA显卡驱动重新安装(记录)
问题
用ssh连接服务器跑深度学习,结果过了一段时间之后发现ssh连接中断了,出现
packet_write_wait: Connection to xxx Port xx: Broken pipe
这个估计是我的ssh客户端和服务器长时间没得到响应导致的,修改了KeepAlive请求的发现间隔时间也无济于事,但最重要的是,ssh的断开居然回导致显卡驱动崩了!
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running
服务器没有更改过内核版本,估计应该就是ssh断连所导致的,寻求解决方案无果后,无奈只能重装了。
.run文件重新安装
-
下载好对应版本的显卡驱动.run文件
-
关闭X-Window服务
sudo service lightdm stop
-
执行安装命令(注意:–no-opengl-files一定要附上,不然可能出现问题)
sudo ./NVIDIA-Linux-x86_64-430.40.run --no-opengl-files
-
进入安装界面:
正常选择yes或ok一路跳过即可,遇到这个选项:Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
选择yes
-
完成安装后开启X-Window服务
sudo service lightdm start ```
-
输入命令nvidia-smi验证是否安装成功
安装完成!
但是为什么ssh断开连接会导致这个问题还没有弄清楚,难道是因为gpu跑着跑着突然中断会影响显卡驱动吗