我的AI之路(6)--安装PyTorch

12 篇文章 0 订阅
8 篇文章 0 订阅

Torch和Torchvision的版本对应关系参见: https://pypi.org/project/torchvision/    

这篇文章以前写的东西实在是太古老无用了,删了,写点最新的东西,现在安装pytorch比以前好多了,因为国内有了阿里云之类的镜像服务器,不用忍受几年前只能从官网https://pytorch.org/安装的漫长等待和下载经常中断的痛苦了。但是呢,有个要点要知道的是,作为框架,Pytorch和TensorRT一样,特定的版本都依赖于特定的CUDA版本,而且pytorch对CUDA的支持总是落后几个小版本,例如当前(2021年8月),CUDA有11.4版了,可是最新的torch1.9和torchvision0.10还停留在只支持CUDA11.1版:

所以在安装pytorch的环境时,不要盲目安装最新的CUDA,一定要先看看当前的pytorch版本支持的CUDA版本是什么,那么安装的CUDA版本不能高于这个版本,如果安装了更高的CUDA版本,会出现什么问题呢?一般是在运行到使用cuda的代码时抛出类似这样的错误:

GeForce RTX 3090 with CUDA capability sm_86 is not compatible with the current PyTorch installation.
The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_70.
If you want to use the GeForce RTX 3090 GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/

  warnings.warn(incompatible_device_warn.format(device_name, capability, " ".join(arch_list), device_name))
>>> print(a)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/python3/lib/python3.9/site-packages/torch/tensor.py", line 193, in __repr__
    return torch._tensor_str._str(self)
  File "/usr/local/python3/lib/python3.9/site-packages/torch/_tensor_str.py", line 383, in _str
    return _str_intern(self)
  File "/usr/local/python3/lib/python3.9/site-packages/torch/_tensor_str.py", line 358, in _str_intern
    tensor_str = _tensor_str(self, indent)
  File "/usr/local/python3/lib/python3.9/site-packages/torch/_tensor_str.py", line 242, in _tensor_str
    formatter = _Formatter(get_summarized_data(self) if summarize else self)
  File "/usr/local/python3/lib/python3.9/site-packages/torch/_tensor_str.py", line 90, in __init__
    nonzero_finite_vals = torch.masked_select(tensor_view, torch.isfinite(tensor_view) & tensor_view.ne(0))
RuntimeError: CUDA error: no kernel image is available for execution on the device

其实上面的错误很误导人,表明上看好像是你安装的pytorch版本低了,不支持当前的比较新的CUDA版本,当然这是一种可能(例如当前的CUDA是支持RTX3090的CUDA 11.1.1(顺便多说一句,根据我的亲身经历,至少CUDA11.1.1才能让RTX3090正常跑起来,否则会出现跑步起来或者跑起来后性能非常差的问题),而pytorch版本是只支持CUDA10.2的,那么也会报这种错误),但是当你安装的CUDA版本(假设11.2)高于你安装的pytorch版本支持的CUDA(假设11.1)版本时,也会出现上面这样错误的。

另外,在国内机器上安装pytorch时,如果不是最新的版本,无需使用官网上面列出的命令从官网安装,而是从阿里云之类的国内镜像服务器上安装,会快很多,例如:

pip install -i http://mirrors.aliyun.com/pypi/simple/  --trusted-host  mirrors.aliyun.com torch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0

我的AI之路(1)--前言

我的AI之路(2)--安装Fedora 28

我的AI之路(3)--安装Anaconda3 和Caffe

我的AI之路(4)--在Anaconda3 下安装Tensorflow 1.8

我的AI之路(5)--如何选择和正确安装跟Tensorflow版本对应的CUDA和cuDNN版本

我的AI之路(6)--在Anaconda3 下安装PyTorch

我的AI之路(7)--安装OpenCV3_Python 3.4.1 + Contrib以及PyCharm

我的AI之路(8)--体验用OpenCV 3的ANN进行手写数字识别及解决遇到的问题

我的AI之路(9)--使用scikit-learn

我的AI之路(10)--如何在Linux下安装CUDA和CUDNN

我的AI之路(11)--如何解决在Linux下编译OpenCV3时出现的多个错误

我的AI之路(12)--如何配置Caffe使用GPU计算并解决编译中出现的若干错误

我的AI之路(13)--解决编译gcc/g++源码过程中出现的错误

我的AI之路(14)--Caffe example:使用MNIST数据集训练和测试LeNet-5模型

我的AI之路(15)--Linux下编译OpenCV3的最新版OpenCV3.4.1及错误解决

我的AI之路(16)--云服务器上安装和调试基于Tensorflow 1.10.1的训练环境

我的AI之路(17)--Tensorflow和Caffe的API及Guide

我的AI之路(18)--Tensorflow的模型安装之object_detection

我的AI之路(19)--如何在Windows下安装pycocotools PythonAPI

我的AI之路(20)--用Tensorflow object_detection跑raccoon数据集

我的AI之路(21)--用Tensorflow object_detection跑PASCAL VOC 2012数据集

我的AI之路(22)--使用Object_Detection_Tensorflow_API

我的AI之路(23)--在Windows下编译Bazel和使用Bazel编译tensorflow

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Arnold-FY-Chen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值