1.按Ctrl+alt+f1进入字符界面命令行
检查gcc:gcc --version
检查cuda:nvcc -V
显示本机gpu信息:lspci | grep -i nvidia
2.关闭图形界面,
sudo service lightdm stop
lsmod | grep nouveau 如果没有输出则正确,否则需要手动禁掉nouveau(方法可以参考前面的安装nvidia驱动)
3.卸载驱动
sudo apt-get remove --purge nvidia-*
sudo apt-get autoremove
sudo sh NVIDIAxxx.run --uninstall
4.重新安装驱动
run文件的安装需要先安装gcc-multilib:sudo apt install gcc-multilib
sudo sh ./NVIDIA-Linux-x86_64-390.87.run --no-x-check --no-nouveau-check --no-opengl-files
安装选项为:accept;对于系统中已经存在一个驱动选择Continue installation;对于the distribution-provided pre-install script failed!选择Continue;对于安装32位选择NO;对于使用nvidia-xconfig utility to automatically update your X Configuration files等选择NO;对于是否使用DKMS来注册kernel module选择No;
如果出现:不能加载nvidia-drm模块问题和后面的ERROR:安装失败等信息的话,再重启一下再来一遍卸载重装基本就可以了。
apt 安装:
(1)添加Graphic Drivers PPA:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
(2)寻找合适的驱动版本:
ubuntu-drivers devices
(3)安装驱动
sudo apt install nvidia-390
5.nvidia-smi检查有没有输出从新打开图形界面,sudo service lightdm start
6.出现登录界面输入密码就可以登入进去了.重启可以解决卡顿的问题。
但是出现另外一个问题,就是cuda用不了了,运行程序,检测出来
RuntimeError: cuda runtime error (38) : no CUDA-capable device is detected at /opt/conda/conda-bld/pytorch_1549628766161/work/aten/src/THC/THCGeneral.cpp:51
那么
1.卸载原来的cuda,
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
sudo rm -rf /usr/local/cuda-9.0
2.安装cuda,
sudo sh cuda_9.0.176_384.81_linux.run
安装过程说明:accept;不安装驱动no;安装toolkit 选择yes;全是默认路径;同意创建软连接;安装测试选择yes
sudo sh cuda_9.0.176.1_linux.run
sudo sh cuda_9.0.176.2_linux.run
sudo sh cuda_9.0.176.3_linux.run
sudo sh cuda_9.0.176.4_linux.run
接下来的步骤和之前的那篇安装cuda的一样