学习 AI 必定要用显卡来跑模型,而使用显卡需要用到 cuda 和 cuDNN。此外,还需要考虑深度学习框架以及它们版本之间的问题。简单的说,配置环境是一件极其麻烦的事情,稍有不慎将功亏一篑。以下将记录自己配置的环境。
Windows系统
安装 CUDA 和 cuDNN
查看电脑能安装 CUDA 最高版本的驱动,只要低于该版本的 CUDA 都能使用。由图可知理论上只要 CUDA 版本的驱动低于 12.2 都能安装成功。
nvidia-smi
安装 CUDA 和 cuDNN,安装教程如下,只要跟着教程走基本不会有问题。
CUDA 和 cuDNN 官方链接:
- CUDA:https://developer.nvidia.com/cuda-toolkit-archive
- cuDNN:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse805-110
CUDA 和 cuDNN 安装教程:
- CUDA 安装:https://blog.csdn.net/qq_44111805/article/details/128281503
- cuDNN 安装:下载cuda和cudnn(11.8版本)_cudnn下载-CSDN博客
只有以上的环境配置完成后才能安装 pytorch 或 tensorflow 框架,接下来将详细介绍 pytorch 和 tensorflow 的安装流程。
安装conda
由于电脑安装的是 Windows 系统,故以下配置的环境都是在 Windows 环境下进行。为了方便且快速地创建 Python 虚拟环境,我们使用 anaconda 或 miniconda 环境管理器,里面安装了很多第三方库,有助于简化配置环境的工作量。关于 anaconda 或 miniconda 的安装网上教程非常多,这里不过多赘述。
安装 pytorch
与 tensorflow 相比,pytorch 真的很容易安装,只需要考虑 Python、CUDA 和 torch 的版本即可,下面链接可以查看 torch、torchvison 和 torch 对应的版本。
版本对应网址:GitHub - pytorch/vision: Datasets, Transforms and Models specific to Computer Vision
下面这张图片来自 pytorch 官方网站,这条命令有如下含义:
- 使用该链接安装时会同时安装 torch、torchvision 和 torchaudio 框架
- 该命令会从国外网站( pytorch 官网)下载源码并安装,所以需要翻墙
- 安装该版本的 torch 必须需要安装高于 CUDA==11.8 的版本(红框所示),安装更高版本也是可以的,pytorch 中 CUDA 版本可以向下兼容,tensorflow 用得很少,不是很清楚。
知道上述命令的含义后,接下来就可以开始配置环境
步骤一:安装 CUDA
步骤二:创建与 torch 版本对应的 Python 虚拟环境
# 创建环境, d2l 为环境名字, 自己定义
conda create -n d2l python=3.8
# 激活环境
conda activate d2l
步骤三:切换到刚才创建的虚拟环境
cd D:\anaconda\envs\d2l
步骤三:安装 torch
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
步骤四:验证是否安装成功,如果出现 True 说明安装的是 torch GPU。
# 进入 Python 编译器
python
# 导入 torch 并查看其版本
import torch
torch.__version__
# 检查 torch 能否正常使用 GPU
torch.cuda.is_available()
安装 tensorflow
tensorflow 环境的配置比较麻烦,需要考虑cuda、cuDNN 和 tensorflow 版本对应关系,稍有不慎则配置失败。由于我使用 tensorflow_gpu-2.4.0,因此需要先安装 CUDA==11.0 和 cuDNN==8.0 的版本。由于 CUDA 和 cuDNN 的安装流程是一样的,只是版本不一样而已,这里不过多赘述。关于 tensorflow 的安装流程如下:
步骤一:创建并激活 python 虚拟虚拟环境
# 创建环境
conda create -n tf python=3.8
# 激活环境
conda activate tf
步骤二:切换到刚才创建的环境
cd D:\anaconda\envs\tf
步骤三:安装 tensorflow-gpu,如果不使用镜像源时需要翻墙,我没有翻墙,所以使用阿里云作为镜像源。
注意:别人说使用清华源安装会出问题,我没尝试过,具体不太清楚。
pip install tensorflow-gpu==2.4.0 -i https://mirrors.aliyun.com/pypi/simple/
步骤 四:测试是否成功安装 tensorflow,以及能否正常使用 GPU。当界面出现 True 时说明 tensorflow 已经安装成功。
# 进入 Python 编译器
python
# 导入 tensorflow 并查看其版本
import tensorflow as tf
tf.__version__
# 检查 tensorflow 能否正常使用 GPU
tf.test.is_gpu_available()
Linux系统
后期待补充