NVIDIA Drivers、CUDA、Pytorch安装

        NVIDIA Drivers、CUDA、Pytorch 这三者的版本有着十分紧密的关联,很容易因为版本不对而重复卸载、重装。

        这里写个记录,方便查阅。

一、NVIDIA Drivers、CUDA

NVIDIA Drivers、CUDA 的关系可以在这里看到:

CUDA Compatibilityicon-default.png?t=N7T8https://docs.nvidia.com/deploy/cuda-compatibility/

如下图所示:

上图解释:

  • C - 兼容
  • X - 不兼容
  • 分支 R525、R515、R510、R465、R460、R455、R450、R440、R418、R410、R396、R390 已终止使用,并且不是支持兼容性的目标。
  • 新功能分支(例如 495.xx)不是 CUDA 前向兼容性支持的目标。

CUDA 版本的 Release Note 在这里 

CUDA 12.5 Update 1 Release NotesThe Release Notes for the CUDA Toolkit.icon-default.png?t=N7T8https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html如下图所示:

有时候可以通过上面这个网站了解CUDA新版本的兼容情况。

NVIDIA Drivers、CUDA 的下载方法:

CUDA Toolkiticon-default.png?t=N7T8https://developer.nvidia.com/cuda-downloads如下,选择对就的操作系统、CPU架构、版本等信息

上面给出了对应的 ubuntu 20.04 系统的 runfile 下载方式和安装方式:

wget https://developer.download.nvidia.com/compute/cuda/12.5.1/local_installers/cuda_12.5.1_555.42.06_linux.run
sudo sh cuda_12.5.1_555.42.06_linux.run

解释:

  • 这里的 cuda_12.5.1_555.42.06_linux.run 文件有几个G,
  • 它包含了 NVIDIA Drivers -555.42.06 和 CUDA - 12.5.1

执行 sudo sh cuda_12.5.1_555.42.06_linux.run 后,根据提示来安装即可。

        验证 NVDIA Drivers 是否安装成功的方法:

        使用 nvidia-smi,这是 NVIDIA 提供的一个命令行工具,用于管理和监控 NVIDIA GPU。执行以下命令:

nvidia-smi

        如果 NVIDIA 驱动成功安装并正确加载,你会看到类似以下的输出,显示 GPU 的详细信息:

Thu Jul 15 13:45:27 2024
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.54.06    Driver Version: 535.54.06    CUDA Version: 12.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce GTX 1080    Off  | 00000000:01:00.0  On |                  N/A |
|  0%   33C    P8     7W / 180W |    205MiB /  8192MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1774      G   /usr/lib/xorg/Xorg                160MiB |
|    0   N/A  N/A      2023      G   /usr/bin/gnome-shell               43MiB |
+-----------------------------------------------------------------------------+

        检查 CUDA 是否安装成功的方法是,使用 nvcc 命令来检查 CUDA 编译器的版本。

nvcc --version

        如果安装成功,你应该会看到类似以下的输出,显示 CUDA 的版本信息:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Jul_24_19:09:09_PDT_2024
Cuda compilation tools, release 12.2, V12.2.91
Build cuda_12.2.r12.2/compiler.32484909_64.312

二、Pytorch

        

        Pytorch 的版本与 CUDA 版本有密切的关系。

        最新版本的 Pytorch 的安装文件,在这里下载:

Start Locally | PyTorch Start Locallyicon-default.png?t=N7T8https://pytorch.org/get-started/locally/

        如下图所示:

        安装方法,拷贝下面命令即可安装与 CUDA 12.4 兼容的最新版本 pytorch :

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

        注意,这里的 cu124 是指 CUDA 12.4。

        历史版本 pytorch 的安装文件和方法在这里

Previous PyTorch Versions | PyTorch Installing previous versions of PyTorchicon-default.png?t=N7T8https://pytorch.org/get-started/previous-versions/

        如下图所示:

        拷贝对应的版本来安装即可。

        查看 pythorch 安装成功与否的方法是:首先,打开一个 Python 解释器(如 python 或 ipython),然后尝试导入 PyTorch 并检查其版本:

import torch
print(torch.__version__)

        如果 PyTorch 安装成功,你会看到类似以下的输出,显示 PyTorch 的版本号:

2.2.0

        如果你安装的是支持 CUDA 的 PyTorch 版本,可以检查 CUDA 是否可用:

import torch
print(torch.cuda.is_available())

        如果 CUDA 可用,该命令会输出 True,否则输出 False。

三、总结

        这三个东西总是容易搞错乱,写下这篇文章,希望可以帮到人。

.

        

  • 15
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值