Ubuntu22.04_AI环境部署_CUDA_cuDNN9_cuDNN8

Prerequisites

注意:以下cd的路径文件,请切换到自己文件系统的目录下进行!!!

查看**版本链条**,要确保自己的各个环节版本是适配的:
**nvidia + nvidia-driver + cuda + cuda-toolkit + cudnn + gcc + kernel + pytorch + python**
以下版本号来自官网,更新于2024.5.27

驱动和CUDA兼容版本表1

驱动和CUDA兼容版本表2

环境

在本计算机下,使用的环境如下;
经过官网的版本对齐后,需要安装cuDNN9;

环境版本号
GPU版本NVIDIA GeForce GTX 1650
系统版本ubuntu 22.04
CUDA版本CUDA 12.2
cuDNN版本cuDNN 9.1.1.1

步骤如下:

1. 系统准备

更新系统

sudo apt update && sudo apt upgrade -y

安装基础依赖包

sudo apt install git curl vim build-essential gcc-9 g++-9 python-is-python3 python3-virtualenv

软件&更新
Go to “Software & Updates” then select the “Additional Drivers” tab;
进入如下界面,选择最新版本的(专有,tested)即可;

在这里插入图片描述

2.安装CUDA

下载CUDA安装包,最好copy到home:

wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run

安装CUDA

sudo sh cuda_12.2.2_535.104.05_linux.run

配置环境变量 ,source ~/.bashrc 或者 source ~/.zshrc文件中,在末尾填写以下字段:

export PATH=/usr/local/cuda-12.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

测试CUDA安装,>cuda11.6版本在安装时不提供samples,需要去到github上面下载
https://github.com/NVIDIA/cuda-samples

下载完成后,输入以下,并运行:
注意:切换到该文件所在目录下运行!

cd cuda-samples/Samples/1_Utilities/deviceQuery
make all
make run

在这里插入图片描述
出现以下格式的输出,即为正确:

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.2, CUDA Runtime Version = 12.2, NumDevs = 1
Result = PASS

查看下载好的cuda版本

nvcc -V

3. 安装cuDNN

3.1下载cuDNN压缩包(version<=9.0.0.0,即version8)

解压并复制文件到CUDA目录

tar -zvxf cudnn-11.2-linux-x64-v8.1.1.33.tgz
sudo cp -P cuda/include/cudnn.h /usr/local/cuda-11.2/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-11.2/lib64/
sudo chmod a+r /usr/local/cuda-11.2/lib64/libcudnn*

以上适用于v8的cuDNN,通过下载tar文件的方式配置环境变量

3.2deb文件配置(version>=9.0.0.0)

我们已经安装了显卡驱动程序和CUDA;
如果系统还没有安装zlib包,可先sudo apt-get install zlib1g安装一下;

以下为下载代码:
获取软件包:

wget https://developer.download.nvidia.com/compute/cudnn/9.1.1/local_installers/cudnn-local-repo-ubuntu2204-9.1.1_1.0-1_amd64.deb

安装软件包

sudo dpkg -i cudnn-local-repo-ubuntu2204-9.1.1_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn9-cuda-12

3.3刷新库

sudo apt-get update

3.4 安装代码样例和官方文档

sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/libcudnn9-samples_9.1.1.17-1_all.deb

3.5 安装运行库

sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn9_9.1.1-1_amd64.deb
sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/cudnn9-cuda-12_9.1.1.17-1_amd64.deb

3.6 安装扩展库

sudo apt-get -y install /var/cudnn-local-repo-ubuntu2204-9.1.1/libcudnn9-dev-cuda-12_9.1.1.17-1_amd64.deb

3.7更新库

sudo apt-get update

3.8验证cuDNN安装是否成功

3.8.1方法一(mnistCUDNN):
3.8.1.1 切换目录并进行测试
cp -r /usr/src/cudnn_samples_v9/ $HOME
cd $HOME/cudnn_samples_v9/mnistCUDNN
make clean && make
3.8.1.2 如果遇到缺少FreeImage.h
3.8.1.3 安装:

sudo apt-get install libfreeimage3 libfreeimage-dev

3.8.1.4 运行:

./mnistCUDNN

在这里插入图片描述
出现以上即为成功

3.8.2 方法二:烟雾测试(smoke)
3.8.2.1 下载依赖
sudo apt install build-essential pkg-config cmake cmake-qt-gui ninja-build valgrind
sudo apt install python3 python3-wheel python3-pip python3-venv python3-dev python3-setuptools
3.8.2.2创建虚拟环境
python3 -m venv ~/venv/torchgpu
3.8.2.3激活环境
source venv/torchgpu/bin/activate
3.8.2.4安装pytorch以及内核
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
pip install ipykernel
python -m ipykernel install --user --name TORCH-GPU --display-name "PyTorch GPU"
3.8.2.5安装依赖库确保make
sudo apt-get install freeglut3 freeglut3-dev
3.8.2.6 运行烟雾测试
cd cuda-samples/Samples/5_Domain_Specific/smokeParticles 
make all
make run

在这里插入图片描述

3.9使用nvidia-smi查看GPU使用情况

nvidia-smi

在这里插入图片描述

~~~~~~~~~~~~~~~~~~~~跟新于2024.5.28~~~~~~~~~~~~~~~~~~~~~~~~~~~

4 如何删除CUDA和cDNN

# remove删除cudnn头文件和库文件
sudo rm /usr/local/cuda-12.2/include/cudnn*.h
sudo rm /usr/local/cuda-12.2/lib64/libcudnn*
#有其他情况出现欢迎评论区留言

欢迎大家留言讨论!

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值