写在前面的话:
本来最初是安装好了CUDA10.0,但tensorflow-gpu最新的版本1.12目前并不支持CUDA10.0 /CUDA9.2(都会出现libualsu 9.0.so缺失问题),因此只好卸载重装CUDA9.0,所以本流程从CUDA卸载写起,同时请大家不要轻易升级新版本。(所有操作都请在Security Boot-Disabled的条件下进行)
基本流程及问题处理
1. CUDA卸载
- 按照官网文档,通过deb包安装的CUDA10.0采用以下步骤进行卸载,基本保证可以卸载干净
sudo apt-get --purge remove cuda sudo apt-get autoremove cuda sudo apt-get remove cuda* cd /usr/local/ sudo rm -r cuda-10.0 sudo apt-get autoclean
- 采用run文件安装的,可以用如下办法卸载
sudo perl /usr/local/cuda-9.2/bin/uninstall_cuda_9.2.pl sudo rm -r /usr/local/cuda-9.2
2.Nvidia显卡驱动安装
卸载CUDA后,Nvidia的驱动也随之失效了,因此需要重新安装Nvidia驱动。
问题1——驱动选择
- 从Nvidia官网下载了最新的410.78驱动的run文件,但试遍网上各种方法也没能解决循环登陆问题,可能是Ubuntu18.04和新驱动有冲突,很多Ubuntu16.04的升级显卡驱动后也都再次陷入循环登陆问题。最后只能通过Ubuntu系统自带软件更新安装Nvidia-390专有驱动,终于可以顺利启动。
- 在安装CUDA10.0时deb包是会对驱动自动更新,但在安装CUDA9.0时使用deb包中的驱动是会出现问题的,可能与CUDA9.0没提供Ubuntu18.04的版本相关,根据安装要求选择nvidia-384以上版本的驱动安装,否则都会出现问题。 <