由于本人的cuda是8.0,cudnn是6.0,显卡驱动384,在tensorflow上可以正常使用gpu,但在pytorch,现在已经不能安装cuda8版本的torch(wheel方式亲测不可行),因此卸载原有版本,安装cuda10.1及cudnn,显卡驱动
卸载原有cuda
sudo apt-get remove --purge nvidia*
执行完上述命令后会有提示有残留,按照提示进行删除
从nvidia官网下载适配于显卡的cuda、cudnn
(如果nvidia官网给你报404,不要悲伤,不要哭泣,去找同学帮忙下一个)
本人显卡为gtx 1050ti,可以使用最新的cuda,但是由于pytoch官方支持cuda10.1和cuda9.2,所以我下载了cuda10.1、cudnn7.6
CUDA下载链接:https://developer.nvidia.com/cuda-toolkit-archive
installer type为runfile
根据官网教程安装
nvcc --version
CUDNN下载链接:https://developer.nvidia.com/rdp/cudnn-archive
若下载文件后缀名为.solitairetheme8,重命名文件后缀名为.tgz,然后解压
tar -xvf cudnn-10.1-linux-x64-v7.6.4.38.tgz
解压后得到cuda文件夹:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
检查是否安装成功:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
安装完毕
禁用nouveau驱动
无论以前是否有驱动,都应该执行:
sudo vim /etc/modprobe.d/blacklist.conf
添加:
blacklist nouveau
options nouveau modeset=0
执行:
sudo update-initramfs -u
然后重启电脑,重启后输入:
lsmod | grep nouveau
若无输出则证明驱动禁用成功
安装新驱动
按ctrl+alt+f1进入无图形页面
sudo service lightdm stop
sudo ./NVIDIA-Linux-x86_64-xxxx.run --no-opengl-files #xxxx为具体的cuda版本号 -no-opengl-files一定要加,本人没加导致一直循环登陆,只能再次重装。。。。
输入上条指令后选择默认的选项,一直回车即可,安装完毕后
sudo service lightdm start
开始登陆
检测
nvidia-smi
可以看到你的CUDA、显卡及驱动版本,至此安装完毕
如有问题,可发邮件至hhsupremehh@gmail.com