一、问题
torch.cuda.is_available()
深度学习中,使用torch.cuda.is_available()返回False,是无法使用gpu的,所以需要找到pytorch和cuda的对应关系,不然安装torch的是cpu版本,也是无法使用gpu的
安装错误版本,项目会各种出错,哪怕安装了torch 也无法使用运行项目。
当前把几个基础库版本提取出来,版本对应具体如下:
1.1 查询远程库里版本
可以尝试输入错误版本进行查询pip install torch==x.xx+cu119
或者制定源输入:
pip install torch==x.xx+cu119 -f https://download.pytorch.org/whl/torch_stable.html
具体会输出如下,可以看到当前源中支持的版本
我是指定源输入,采集的版本如下:
torch
(from versions: 1.11.0, 1.11.0+cpu, 1.11.0+cu113, 1.11.0+cu115, 1.12.0, 1.12.0+cpu,
1.12.0+cu113, 1.12.0+cu116, 1.12.1, 1.12.1+cpu, 1.12.1+cu113, 1.12.1+cu116, 1.13.0,
1.13.0+cpu, 1.13.0+cu116, 1.13.0+cu117, 1.13.1, 1.13.1+cpu, 1.13.1+cu116, 1.13.1+cu117,
2.0.0, 2.0.0+cpu, 2.0.0+cu117, 2.0.0+cu118, 2.0.1, 2.0.1+cpu, 2.0.1+cu117, 2.0.1+cu118,
2.1.0, 2.1.0+cpu, 2.1.0+cu118, 2.1.0+cu121, 2.1.1, 2.1.1+cpu, 2.1.1+cu118, 2.1.1+cu121,
2.1.2, 2.1.2+cpu, 2.1.2+cu118, 2.1.2+cu121, 2.2.0, 2.2.0+cpu, 2.2.0+cu118, 2.2.0+cu121,
2.2.1, 2.2.1+cpu, 2.2.1+cu118, 2.2.1+cu121, 2.2.2, 2.2.2+cpu, 2.2.2+cu118, 2.2.2+cu121)
torchvision
(from versions: 0.1.6, 0.2.0, 0.12.0, 0.12.0+cpu, 0.12.0+cu113, 0.12.0+cu115, 0.13.0,
0.13.0+cpu, 0.13.0+cu113, 0.13.0+cu116, 0.13.1, 0.13.1+cpu, 0.13.1+cu113, 0.13.1+cu116,
0.14.0, 0.14.0+cpu, 0.14.0+cu116, 0.14.0+cu117, 0.14.1, 0.14.1+cpu, 0.14.1+cu116,
0.14.1+cu117, 0.15.0+cpu, 0.15.0+cu117, 0.15.0+cu118, 0.15.1, 0.15.1+cpu, 0.15.1+cu117,
0.15.1+cu118, 0.15.2, 0.15.2+cpu, 0.15.2+cu117, 0.15.2+cu118, 0.16.0, 0.16.0+cpu,
0.16.0+cu118, 0.16.0+cu121, 0.16.1, 0.16.1+cpu, 0.16.1+cu118, 0.16.1+cu121, 0.16.2,
0.16.2+cpu, 0.16.2+cu118, 0.16.2+cu121, 0.17.0, 0.17.0+cpu, 0.17.0+cu118, 0.17.0+cu121,
0.17.1, 0.17.1+cpu, 0.17.1+cu118, 0.17.1+cu121, 0.17.2, 0.17.2+cpu, 0.17.2+cu118,
0.17.2+cu121)
torchaudio
versions: 0.11.0, 0.11.0+cpu, 0.11.0+cu113, 0.11.0+cu115, 0.12.0, 0.12.0+cpu,
0.12.0+cu113, 0.12.0+cu116, 0.12.1, 0.12.1+cpu, 0.12.1+cu113, 0.12.1+cu116, 0.13.0,
0.13.0+cpu, 0.13.0+cu116, 0.13.0+cu117, 0.13.1, 0.13.1+cpu, 0.13.1+cu116, 0.13.1+cu117,
2.0.0+cpu, 2.0.0+cu117, 2.0.0+cu118, 2.0.1, 2.0.1+cpu, 2.0.1+cu117, 2.0.1+cu118, 2.0.2,
2.0.2+cpu, 2.0.2+cu117, 2.0.2+cu118, 2.1.0, 2.1.0+cpu, 2.1.0+cu118, 2.1.0+cu121, 2.1.1,
2.1.1+cpu, 2.1.1+cu118, 2.1.1+cu121, 2.1.2, 2.1.2+cpu, 2.1.2+cu118, 2.1.2+cu121, 2.2.0,
2.2.0+cpu, 2.2.0+cu118, 2.2.0+cu121, 2.2.1, 2.2.1+cpu, 2.2.1+cu118, 2.2.1+cu121, 2.2.2,
2.2.2+cpu, 2.2.2+cu118, 2.2.2+cu121
找到一些可以直接安装的命令,具体如下 (torch2.5.1)
# ROCM 6.1 (Linux only)
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/rocm6.1
# ROCM 6.2 (Linux only)
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/rocm6.2
# CUDA 11.8
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu118
# CUDA 12.1
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121
# CUDA 12.4
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu124
# CPU only
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cpu
二、查询cuda真实驱动版本
驱动选择安装地址
2.1查询驱动最大支持版本
cmd命令输入:
nvidia-smi
驱动版本是:12.4,这个不是最终版本,只是最大支持版本
2.2 查询运行版本
nvcc -V
这个10.0 才是真正安装的版本,运行版本,最终和我们代码沟通的是这个版本,记住了
*如果不存在nvcc 那么就是没有安装cuda Toolkit 请先安装,具体安装网址,下载安装即可,版本需要低于cuda的版本(nvidia-smi 查询)
https://developer.nvidia.com/cuda-toolkit-archive
三、torch和torchvision 对应关系
3.1 项目地址(查询版本对应关系)
https://github.com/pytorch/visionhttps://github.com/pytorch/visionhttps://github.com/pytorch/vision
3.2 部分截图查询
四、torch和TorchAudio对应关系
4.1 原始地址
4.2 部分截图
五、验证
这里我的版本:python 是3.10的 ,
我选择的torch版本是2.0.0 根据版本对应要求,
我选择的torchvision 为0.15.0 、torchaudio为2.0.1
这里我的gpu版本是10.0 ,选择的是118,一般高版本可以兼容低版本,建议如果不是项目必须,那么还是安装最新版,效率稳定性好点
具体执行如下:
pip install torch==2.0.0+cu118 torchvision==0.15.0+cu118 torchaudio==2.0.1+cu118 -f https://download.pytorch.org/whl/torch_stable.html
安装成功后,查询是否可以使用了
这里我们已经看到版本已经变更了,也就已经成功了