torchvision详细介绍

前言

深度学习的道路漫漫,唯有不断总结,脚踏实地才能造就一番阵地,也不断的勉励自己,不要放弃,相信自己可以哒。

torchvision详细介绍

t o r c h v i s i o n torchvision torchvision p y t o r c h pytorch pytorch的一个图形库,它服务于PyTorch深度学习框架的,主要用来构建计算机视觉模型。以下是torchvision的构成:
(图形库,构建计算机是视觉模型)

  • torchvision.datasets: 一些加载数据的函数及常用的数据集接口
  • torchvision.models: 包含常用的模型结构,(含预测训练模型),例如:AlexNet、VGG、ResNet
  • torchvision.transforms:常用的图片变换、例如裁剪、旋转等。
  • torchvision.utils:其他一些有用的方法。

torchvision.transforms

  • torchvision.transforms: 主要用于常见的一些图形变换
  • torchvision.transforms.Compose()类:这个类的主要作用是传串联多个图片变换的操作,这个类的构造很简单。
# 图像预处理步骤
transform = transforms.Compose([
    transforms.Resize(96), # 缩放到 96 * 96 大小
    transforms.ToTensor(), # 转化为Tensor
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) # 归一化
])

torchvision.datasets

用来进行数据加载的,pytorch团队在这个包中帮我们提前处理了好多图片数据集

MNISTCOCO
Captions
Detection
LSUN
ImageFolder
Imagenet-12
CIFAR
STL10
SVHN
PhotoTour

# Image processing
img_transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,)),
])
# MNIST dataset
mnist = datasets.MNIST(
    root='./data/', train=True, transform=img_transform, download=True)
# Data loader
dataloader = torch.utils.data.DataLoader(
    dataset=mnist, batch_size=batch_size, shuffle=True)

torchvision.models

  • torchvision.models 中为我们提供了已经训练好的模型,让我们可以加载之后,直接使用。
  • torchvision.models:模块的子模块包含以下模型结构

AlexNet
VGG
ResNet
SqueezeNet
DenseNet

import torchvision.models as models
resnet18 = models.resnet18()
alexnet = models.alexnet()
squeezenet = models.squeezenet1_0()
densenet = models.densenet_161()

也可以使用pretrained = True来加载一个别人预训练好的model。

import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
alexnet = models.alexnet(pretrained=True)

整体效果

# 我们这里还是对MNIST进行处理,初始的MNIST是 28 * 28,我们把它处理成 96 * 96 的torch.Tensor的格式
from torchvision import transforms as transforms
import torchvision
from torch.utils.data import DataLoader
 
# 图像预处理步骤
transform = transforms.Compose([
    transforms.Resize(96), # 缩放到 96 * 96 大小
    transforms.ToTensor(),
    transforms.Normalize((0.5), (0.5)) # 归一化
])
 
DOWNLOAD = True
BATCH_SIZE = 32
 
train_dataset = torchvision.datasets.MNIST(root='./data/', train=True, transform=transform, download=DOWNLOAD)
 
 
train_loader = DataLoader(dataset=train_dataset,
                          batch_size=BATCH_SIZE,
                          shuffle=True)
 
print(len(train_dataset))
print(len(train_loader))



  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
torchvisionPyTorch的一个专门用于计算机视觉任务的库,它提供了一系列预训练的模型架构、数据转换工具和常用的计算机视觉数据集等。下面是torchvision中一些常用的结构和功能的介绍: 1. 模型架构:torchvision提供了一些流行的计算机视觉模型架构,例如AlexNet、VGG、ResNet、MobileNet等。这些模型可以通过简单的调用进行加载和使用,也可以用于迁移学习。 2. 数据转换工具:torchvision提供了一系列用于数据预处理和增强的工具,如图像缩放、裁剪、翻转、旋转、归一化等。这些工具可以方便地在数据加载和模型训练过程中使用,用于提升模型性能。 3. 数据集:torchvision支持常见的计算机视觉数据集的加载和处理,如MNIST、CIFAR-10、ImageNet等。它提供了简单的API来加载这些数据集,并且可以方便地进行数据增强和批量化处理。 4. 预训练模型:torchvision提供了一些在大规模图像数据集上预训练的模型权重,可以直接加载并在自己的任务上进行微调或特征提取。这些预训练模型可以用于各种计算机视觉任务,如图像分类、目标检测、语义分割等。 5. 物体检测和分割:torchvision还提供了一些用于物体检测和分割任务的工具和模型,如Faster R-CNN、Mask R-CNN等。这些模型可以用于检测图像中的物体位置和进行像素级别的语义分割。 以上仅是torchvision中一些常用的结构和功能的介绍,它还有其他更多的功能和模块可供使用。你可以查阅PyTorch官方文档中的torchvision部分以获取更详细的信息和示例代码。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

big_matster

您的鼓励,是给予我最大的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值