pytorch十一：计算机视觉工具包：torchvision

最新推荐文章于 2024-02-25 14:16:51 发布

东城青年

最新推荐文章于 2024-02-25 14:16:51 发布

阅读量725

点赞数

分类专栏： pytorch

本文链接：https://blog.csdn.net/qq_24946843/article/details/89452118

版权

pytorch 专栏收录该内容

31 篇文章 453 订阅 ¥9.90 ¥99.00

订阅专栏

PyTorch的torchvision工具包简化了计算机视觉研究，提供模型加载、数据加载等功能。包括预训练模型如Alex-Net、VGG和ResNet，常用数据集MNIST、CIFAR10/100，以及数据预处理操作。此外，torchvision提供make_grid和save_img用于图片展示和保存。

摘要由CSDN通过智能技术生成

计算机视觉是深度学习中最重要的一类应用，为了方便研究者应用，pytorch专门开发了一个视觉工具包torchvision。

可通过pip install torchvision安装。

torchvision主要包含以下三部分：

模型加载

models：提供深度学习中各种经典网络结构及与训练好的模型，包括Alex-Net、VGG系列、ResNet系列、Inception系列等。
datasets：提供常用的数据集下载，设计上都是继承torch.utils.data.Dataset，主要包括MNIST、CIFAR10/100、ImageNet、COCO等。
transform：提供常用的数据预处理操作，主要包括对Tensor及PIL Image对象的操作

from torchvision import models
from torch import nn

#加载预训练模型，如果不存在会下载
#预训练的模型保存在~/.torch/models/下面
resnet34 = models.resnet34(pretrained=True,num_classes=1000)

#修改最后的全连接层为10分类问题（默认是ImageNet上的1000分类）
resnet34.fc = nn.Linear(5

了解本专栏