【DeepLearning】Ubuntu 中深度学习环境配置完整流程

1 显卡驱动

支持 CUDA 的所有显卡型号: Link

  1. 查询显卡型号
lspci -nn | grep VGA

在这里插入图片描述

Vendor ID:Device ID10de:2684,在 Link 或浏览器中搜索。

在这里插入图片描述

  1. 填写显卡信息: Link

在这里插入图片描述

  1. 选择要下载的版本(可以选个新一点的 )

在这里插入图片描述

  1. 运行 .run 文件
sudo sh ./NVIDIA-Linux-x86_64-*.run
  1. 测试
nvidia-smi

2 CUDA

参考文档: Link

  1. 选择要安装的版本: Link
  • 先通过 nvidia-smi 查看驱动支持的 CUDA 最高版本,我的最高版本为 12.4
  • 然后在此范围内选择项目中比较常用的 CUDA 版本,只要低于最高版本都可以

在这里插入图片描述

  1. 查询本机系统信息
uname -m && cat /etc/*release

在这里插入图片描述

  1. 选择你的平台,下载相应的 .run 文件并运行

在这里插入图片描述

安装完成后,得到下面的输出信息。

在这里插入图片描述

  1. 修改 PATHLD_LIBRARY_PATH 变量来设置开发环境

参考文档: Link

vim ~/.bashrc

# 添加以下内容
# >>> cuda >>>
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
# <<< cuda <<<
  1. 测试
nvcc -V

在这里插入图片描述

3 cuDNN

参考文档: Link

CUDA 和 cuDNN 的兼容性

在这里插入图片描述

3.1 cuDNN 9.0.0 之前版本

  1. 安装 Zlib
sudo apt install zlib1g
  1. 下载 cuDNN: Link,要注册个帐号

在这里插入图片描述

  1. 根据安装的 CUDA 版本选择 cuDNN 版本,可以选新一点的

在这里插入图片描述

  1. 下载压缩包

在这里插入图片描述

# 解压下载的文件
tar -xvf cudnn-linux-x86_64-8.x.x.x_cudaX.Y-archive.tar.xz

# 复制到 CUDA 的目录下
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include 
sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
  1. 测试(有点麻烦,可以忽略)
sudo apt-get install libcudnn8=${cudnn_version}-1+${cuda_version}
sudo apt-get install libcudnn8-dev=${cudnn_version}-1+${cuda_version}
sudo apt-get install libcudnn8-samples=${cudnn_version}-1+${cuda_version}

${cudnn_version} = 8.x.x.x
${cuda_version} = cuda12.1 or cuda11.8…
Note: 以自己安装的版本为准!

cp -r /usr/src/cudnn_samples_v8/ $HOME
cd  $HOME/cudnn_samples_v8/mnistCUDNN
make clean && make
./mnistCUDNN

如果 cuDNN 正确安装和运行,你会看到类似以下的信息:Test passed!

3.2 cuDNN 9.0.0 之后版本

参考文档: Link

在这里插入图片描述

cuDNN 9 可以与之前的 cuDNN 版本共存,如果有旧版本的 cuDNN,安装 cuDNN 9 时不会自动删除旧版本。

如果要在旧版本与新版本之间切换,执行 sudo update-alternatives --config libcudnn 并选择相应的 cuDNN 版本。

下面是安装步骤:

参考文档: Link

  1. 选择安装的版本: Link

在这里插入图片描述

  1. 选择你的平台,下载相应的软件包

在这里插入图片描述

wget https://developer.download.nvidia.com/compute/cudnn/9.6.0/local_installers/cudnn-local-repo-ubuntu2004-9.6.0_1.0-1_amd64.deb

sudo dpkg -i cudnn-local-repo-ubuntu2004-9.6.0_1.0-1_amd64.deb

sudo cp /var/cudnn-local-repo-ubuntu2004-9.6.0/cudnn-*-keyring.gpg /usr/share/keyrings/

sudo apt-get update
  1. 安装 cuDNN
  • Install for CUDA 11
sudo apt-get -y install cudnn9-cuda-11

在这里插入图片描述

  • Install for CUDA 12
sudo apt-get -y install cudnn9-cuda-12

3.3 pip 安装 cuDNN 9.0.0 之后版本

参考文档: Link

NVIDIA 提供了通过 pip 安装 cuDNN 的 Python Wheels,但是在 pip 环境之外使用 cuDNN 时,还须配置主机环境。

  1. 更新 pip 和 wheel 模块
python3 -m pip install --upgrade pip wheel
  1. 安装 cuDNN
  • Install for CUDA 11
python3 -m pip install nvidia-cudnn-cu11

若要指定 cuDNN 版本,运行:

python3 -m pip install nvidia-cudnn-cu11==9.x.y.z
  • Install for CUDA 12
python3 -m pip install nvidia-cudnn-cu12

若要指定 cuDNN 版本,运行:

python3 -m pip install nvidia-cudnn-cu12==9.x.y.z

4 torch

  1. 根据 cuda 和自身需求确定要安装的版本

  2. 下载 .whl 文件: Link
    在这里插入图片描述

  3. 安装

conda activate xxx
pip install torch-*+cu*-cp*-cp*m-linux_x86_64.whl
  1. 测试
python

>>> import torch
>>> torch.cuda.is_available()
True
>>> torch.__version__
'1.12.1+cu113'

5 torchvision

  1. 根据 torch 选择对应的 torchvision 版本: Link

在这里插入图片描述

  1. 下载 .whl 文件: Link
    在这里插入图片描述

  2. 安装

conda activate xxx
pip install torchvision-*+cu*-cp*-cp*m-linux_x86_64.whl
  1. 测试
python

>>> import torchvision
>>> torchvision.__version__
'0.13.1+cu113'

6 torchaudio

  1. 根据 torch 选择对应的 torchaudio 版本: Link

在这里插入图片描述

  1. 下载 .whl 文件: Link

在这里插入图片描述

  1. 安装
conda activate xxx
pip install torchaudio-*+cu*-cp*-cp*m-linux_x86_64.whl
  1. 测试
python

>>> import torchaudio
>>> torchaudio.__version__
'0.12.1+cu113'
配置深度学习环境需要注意以下几步: 1. 安装 GPU 驱动:如果你的电脑有 NVIDIA 显卡,需要先安装驱动。可以通过 `ubuntu-drivers devices` 命令来查看建议使用的驱动版本,然后使用 `sudo apt-get install nvidia-driver-<version>` 进行安装。 2. 安装 CUDA:CUDA 是 NVIDIA 提供的并行计算平台和编程模型,用于加速深度学习计算。可以通过官网下载对应版本的 CUDA 安装包,然后按照官方文档进行安装。 3. 安装 cuDNN:cuDNN 是 NVIDIA 提供的深度神经网络加速库,可以进一步优化深度学习计算。可以通过官网下载对应版本的 cuDNN 安装包,然后按照官方文档进行安装。 4. 安装 Anaconda:Anaconda 是一个数据科学环境管理器,可以方便地安装和管理不同的 Python 环境和包。可以通过官网下载对应版本的 Anaconda 安装包,然后按照官方文档进行安装。 5. 创建虚拟环境:可以使用 Anaconda 创建一个新的 Python 环境,以避免与系统 Python 环境冲突。可以使用命令 `conda create --name env-name python=3.7` 来创建一个名为 env-name 的 Python 3.7 环境。 6. 安装深度学习框架:可以使用 conda 或 pip 安装常用的深度学习框架,如 TensorFlow、PyTorch、Keras 等。例如,可以使用命令 `conda install tensorflow-gpu` 安装 TensorFlow GPU 版本。 7. 安装其他依赖:在使用深度学习框架时,可能需要安装其他依赖,如 CUDA Toolkit、cuDNN、numpy、scipy 等。可以使用 conda 或 pip 安装这些依赖。 以上是在 Ubuntu配置深度学习环境的一般步骤,具体操作还需要根据自己的需求和实际情况进行调整。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

G.Chenhui

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值