【ShuQiHere】
在Ubuntu系统上安装CUDA和cuDNN,并配置TensorFlow和PyTorch,以充分利用NVIDIA GPU进行深度学习任务,是每个从事机器学习或深度学习的AI工程师必备的技能。然而,在安装过程中可能会遇到很多问题,例如cuDNN与CUDA版本不匹配、CUDA版本与驱动不兼容等,这些问题都可能导致TensorFlow或PyTorch无法识别你的GPU。这篇文章将详细讲解如何安装CUDA和cuDNN,并避免常见问题。
1. 检查NVIDIA驱动对CUDA的支持
首先,我们需要检查当前NVIDIA驱动程序支持的CUDA版本。运行以下命令:
nvidia-smi
输出结果类似如下:
Tue Aug 20 11:58:06 2024
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.183.01 Driver Version: 535.183.01 CUDA Version: 12.2 |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 NVIDIA GeForce RTX 3060 ... Off | 00000000:01:00.0 Off | N/A |
| N/A 50C P3 N/A / 55W | 8MiB / 6144MiB | 0% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
Driver Version: 535.183.01 CUDA Version: 12.2
看到第一行
Driver Version: 535.183.01 CUDA Version: 12.2
这表示我们的驱动最高支持cuda12.2
2. 检查是否已安装CUDA
接下来,我们检查系统中是否已经安装了CUDA。运行以下命令:
nvcc --version
如果CUDA未安装,系统可能会提示:
Command 'nvcc' not found, but can be installed with:
sudo apt install nvidia-cuda-toolkit
此时,你可以直接运行以下命令,系统会自动安装一个与当前驱动兼容的CUDA版本:
sudo apt install nvidia-cuda-toolkit
或者,你可以访问NVIDIA官网选择并安装特定版本的CUDA:
https://developer.nvidia.com/cuda-downloadshttps://developer.nvidia.com/cuda-downloads选择你的发行版本后运行官网提示的命令即可
安装完成后,再次运行以下命令以确认CUDA版本:
nvcc --version
3. 安装cuDNN
cuDNN是NVIDIA的深度神经网络库,能够为深度学习框架(如TensorFlow和PyTorch)提供加速支持。这里要确保安装的cuDNN版本与CUDA版本匹配(11或12)。
1.首先访问官网
CUDA Deep Neural Network (cuDNN) | NVIDIA Developerhttps://developer.nvidia.com/cudnn
2.选择cuDNN Library
3.选择你的操作系统和发行版等,这个会指引你下载合适的版本,运行官网提示的命令
至此,CUDA和cuDNN的安装已完成。如果你对机器学习感兴趣,可以看看我的下一篇文章,其中将详细介绍如何在TensorFlow和PyTorch中指定使用GPU进行训练。