一、CUDA安装
1、查看显卡驱动支持可安装的最高CUDA版本
可以看出,该电脑最高可支持安装cuda12.0的版本。这可能不是当前的cuda版本,需要在终端用nvcc -V命令查看。
注:一般不需要安装这么高的版本,因为其他与cuda有连接的工具,如pytoch所对应的cuda版本一般不会更新得这么快,安装与需要工具对应的cuda版本即可。截止至2023年6月,pytorch最高仅支持cuda11.8的版本。
2、进入CUDA官网找需要安装的版本
CUDA官网:https://developer.nvidia.com/cuda-toolkit-archive
根据电脑系统配置选择安装方法(runfile这个方法最方便)。
3、下载
在终端运行第一行命令下载安装包,软件安装包会被下载到终端运行该命令的当前路径,直接开终端的话会被下载到Home路线下。(需要自己到官网找对应版本的下载命令,不能直接复制我的)
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
4、安装
在终端运行第二行命令安装CUDA,会进入可视化安装界面。
sudo sh cuda_11.7.0_515.43.04_linux.run
(1)选择“continue”
(2)输入“accept”
(3)安装配置选项(重点)
注:在driver处按回车键,取消选择驱动安装的选项。因为当前显卡驱动已配置好,无需再安装驱动,不取消的话后面会报错,无法正确安装CUDA。
(4)已有路径更新
应该是当前电脑已有其他版本的CUDA,多弹出一个问题选项。cuda symbol link的选择,首次安装,选“yes”,安装额外的版本,选"no"。
5、更新环境变量
(1)打开储存环境变量的文件,输入:
(也可以先在系统盘里检查一下cuda有没有被下载到正确的位置:usr/local/)
gedit ~/.bashrc
找到CUDA环境变量的部分
(2)添加目标环境变量,并保存
export PATH=/usr/local/cuda-11.3/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
注:该步骤也可以切换已有的不同版本的CUDA,修改cuda的版本号即可
(3)更新环境变量配置,输入:
source ~/.bashrc
6、验证
nvcc -V
出现对应CUDA版本的结果即为配置成功。(显示当前为11.3版本)
二、cudnn安装
1、到官网下载cudnn(需要注册邮箱并登陆)
https://developer.nvidia.com/rdp/cudnn-download
选Linux x86_64,而不是Ubuntu版本
2、解压下载的tar文件,得到以下几个文件。
接下来需要做的是需要把include和lib文件夹里的所有文件拷贝的系统盘cuda对应的include和lib文件夹里。
在该目录下打开终端,运行:
sudo cp lib/* /usr/local/cuda-11.3/lib64/
sudo cp include/* /usr/local/cuda-11.3/include/
(选做)给所有用户添加权限:
sudo chmod a+r /usr/local/cuda-11.3/lib64/libcudnn*
sudo chmod a+r /usr/local/cuda-11.3/include/cudnn*
3、验证是否安装成功
终端继续运行:
cat /usr/local/cuda-11.3/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
得到如下结果即为成功:
4、有pytorch的情况下验证方法
python
import torch
from torch.backends import cudnn
print(cudnn.is_available())
print(torch.backends.cudnn.version())
有如下输出即为成功安装: