选择CUDA版本号
需要考虑的有两点:
(1)pytorch适配
https://pytorch.org/get-started/locally/
(2)显卡驱动适配
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
安装cuda
- 打开下载链接
- 选择操作系统、架构、版本、安装方式
ps:如果要选择非最新版本cuda, 点击下方的legacy releases
- 输入
Installation Instructions
中的指令获取安装包并开始安装
### 获取安装包
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
### 开始安装
sudo sh cuda_10.1.243_418.87.00_linux.run
- 安装过程
- 首先会出现一系列协议,一直按住
Enter
键。之后会出现一系列选项。 - 第一个选择
accept
- 第二个记得取消驱动选项.
- 后面全部选择y
- 设置cuda环境变量
输入sudo gedit ~/.bashrc
打开主目录下的.bashrc
文件添加如下内容:
### 注意 12.2为版本号,应当替换为刚刚下载的版本
export PATH="/usr/local/cuda-12.2/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-12.2/lib64:$LD_LIBRARY_PATH"
- 终端运行:
source ~/.bashrc
使之生效 - 检查是否安装成功:
输入nvcc --version
,如果显示如下文字就说明安装成功
- 如果显示错误,注销一下用户
安装cudnn
- 打开下载链接,选择相应的版本并下载。选择方法可参考https://blog.csdn.net/MumuziD/article/details/118760650,建议直接选择
cuDNN Library for Linux (x86_64)
- 进入cudnn压缩包所在的文件夹,解压文件
tar -xvf cudnn-10.1-linux-x64-v7.6.4.38.tgz
- 将文件拷贝到相应cuda目录下
### 注意 10.1为版本号,应当替换为刚刚下载的版本
### 注意安装过程中不要随意切换路径
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64/
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*
- 查看cudnn版本
### 注意 10.1为版本号,应当替换为刚刚下载的版本
cat /usr/local/cuda-10.1/include/cudnn.h | grep CUDNN_MAJOR -A 2
出现如下的信息,则为配置成功
- 注意
如果上述操作无显示,可能是因为cuda及cudnn版本比较新(如cuda 11.3 + cudnn 8.2),cudnn的版本信息存储在cudnn_version.h
文件中。因此需要添加如下操作:
sudo cp cuda/include/cudnn_version.h /usr/local/cuda-11.3/include/
sudo chmod a+r /usr/local/cuda-11.3/include/cudnn_version.h
并使用如下指令查看cudnn版本
cat /usr/local/cuda-10.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
切换cuda版本
如果有安装多个cuda, 只需修改.bashrc
文件中的版本号即可随意切换cuda版本。具体方法见安装cuda一节中的 5. 设置cuda环境变量