因为配置不同的项目,不同的项目使用的tensorflow、pytorch的版本不同,对应的CUDA版本也不同,记录一下,多种版本CUDA的安装和切换。
从图片可见,自己配置了三个版本的CUDA。
下面记录安装和配置过程。
(1)从官网下载所需要版本的CUDA:https://developer.nvidia.com/cuda-toolkit-archive
文件类型为:runfile。
(2)安装CUDA
cd到刚下载的文件目录
sudo sh cuda_10.0.130_410.48_linux.run
一直按回车键到100%,输入accept,后续输入指令选择时一定要看清楚,视情况决定。
最关键的是问是否要安装驱动的时候:install NVIDIA Accelerated Graphics Driver for Linux-x86_64,输入n(no)。因为已安装其他版本的CUDA,是已经配置好驱动的。
问题是否建立一个cuda的软链接:Do you want to install a symbolic link at /usr/local/cuda,输入n,后续我们切换时自己建立软链接。
其他视情况决定,比如一些文件的默认路径等问题。
(3)设置环境变量
在~/.bashrc文件中添加环境变量,如果有配置好的CUDA,这步应该已经完成,如果没有,通过几个export操作配置,配置完后source ~/.bashrc
(4)cudnn的安装
官网下载CUDA对应版本的cudnn:https://developer.nvidia.com/rdp/cudnn-archive
解压完成后,可以看到cuda文件夹,在当前目录打开终端,执行下面命令:
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64/
sudo chmod a+r /usr/local/cuda-10.0/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.0/lib64/libcudnn*
(5)建立指向CUDA-10.0的软链接
sudo rm -rf cuda
sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda
(6)查看此时的CUDA版本和cudnn版本
CUDA版本:
cat /usr/local/cuda/version.txt
nvcc -V
cudnn版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
没有问题则说明配置成功,如果要切换不同的CUDA版本,只需要执行第五步即可。