ubuntu安装cuda10.1及多版本cuda管理
原来是cuda8.0与cuda9共存,现在cuda8.0已逐渐退出,卸载cuda8,安装cuda10.1
并管理cuda9.0与cuda10.1双版本
cuda8.0卸载
sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
sudo rm -r /usr/local/cuda-8.0
卸载残余文件
重新安装cuda10.1
查询cuda与NVIDIA驱动的版本适配
https://developer.nvidia.com/cuda-gpus#compute可查询到NVIDIA gtx1070 与Quadro P2000的算力均为6.1
旧版本的驱动无法支持cuda10.1
安装最新版本的英伟达驱动
#卸载旧版本驱动
sudo apt-get remove –purge nvidia*
#创建配置文件禁用系统自带nouveau驱动
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
#配置文件中加入
blacklist nouveau
option nouveau modeset=0
#更新配置文件
sudo update-initramfs -u
重启电脑
#检验是否禁用成功,终端输入
lsmod | grep nouveau
#无输出则禁用成功
禁用X服务
sudo service lightdm stop
按Ctrl+Alt+F1进入命令行,输入用户名密码登录(通过Ctrl+Alt+F7可返回界面)
输入账号密码
sudo chmod a+x NVIDIA-Linux-x86_64-450.57.run
sudo ./NVIDIA-Linux-x86_64-450.57.run –no-opengl-files –no-x-check –no-nouveau-check
这里安装时忘记加选项了驱动安装成功了
nvidia-smi验证
cuda10.1下载
https://developer.nvidia.com/cuda-toolkit-archive
下载.run文件并安装
sudo chmod a+x cuda_10.1.168_418.67_linux.run
sudo sh cuda_10.1.168_418.67_linux.run
选择不安装驱动
安装完成后,nvcc -V 检验
检验cuda10.1是否可用
cd ~/NVIDIA_CUDA-10.1_Samples/1_Utilities/deviceQuery
make
./deviceQuery
cudnn安装
https://developer.nvidia.com/rdp/cudnn-archive#a-collapse765-101选择cuda10.1对应的cudnn版本
tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64/
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*
#检验是否成功
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
cuda9.0与cuda10.1的版本切换
注意~/.bashrc中的环境变量设置
sudo gedit ~/.bashrc
更新驱动版本后,切换cuda9.0仍可以正常使用
cd /usr/local
sudo rm -rf cuda
sudo ln -s /usr/local/cuda-9.0 /usr/local/cuda