torchvision详细介绍

最新推荐文章于 2024-05-04 11:15:00 发布

big_matster

最新推荐文章于 2024-05-04 11:15:00 发布

阅读量664

点赞数

分类专栏：模块复现文章标签：深度学习 pytorch python

本文链接：https://blog.csdn.net/kuxingseng123/article/details/128194960

版权

模块复现专栏收录该内容

27 篇文章 2 订阅

订阅专栏

前言

深度学习的道路漫漫，唯有不断总结，脚踏实地才能造就一番阵地，也不断的勉励自己，不要放弃，相信自己可以哒。

torchvision详细介绍

$t o r c h v i s i o n$ 是 $p y t o r c h$ 的一个图形库，它服务于PyTorch深度学习框架的，主要用来构建计算机视觉模型。以下是torchvision的构成：
(图形库，构建计算机是视觉模型）

torchvision.datasets: 一些加载数据的函数及常用的数据集接口。
torchvision.models: 包含常用的模型结构，（含预测训练模型），例如：AlexNet、VGG、ResNet等
torchvision.transforms：常用的图片变换、例如裁剪、旋转等。
torchvision.utils：其他一些有用的方法。

torchvision.transforms

torchvision.transforms: 主要用于常见的一些图形变换。
torchvision.transforms.Compose()类：这个类的主要作用是传串联多个图片变换的操作，这个类的构造很简单。

# 图像预处理步骤
transform = transforms.Compose([
    transforms.Resize(96), # 缩放到 96 * 96 大小
    transforms.ToTensor(), # 转化为Tensor
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) # 归一化
])

torchvision.datasets

用来进行数据加载的，pytorch团队在这个包中帮我们提前处理了好多图片数据集。

MNISTCOCO
Captions
Detection
LSUN
ImageFolder
Imagenet-12
CIFAR
STL10
SVHN
PhotoTour

# Image processing
img_transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,)),
])
# MNIST dataset
mnist = datasets.MNIST(
    root='./data/', train=True, transform=img_transform, download=True)
# Data loader
dataloader = torch.utils.data.DataLoader(
    dataset=mnist, batch_size=batch_size, shuffle=True)

torchvision.models

torchvision.models 中为我们提供了已经训练好的模型，让我们可以加载之后，直接使用。
torchvision.models:模块的子模块包含以下模型结构。

AlexNet
VGG
ResNet
SqueezeNet
DenseNet

import torchvision.models as models
resnet18 = models.resnet18()
alexnet = models.alexnet()
squeezenet = models.squeezenet1_0()
densenet = models.densenet_161()

也可以使用pretrained = True来加载一个别人预训练好的model。

import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
alexnet = models.alexnet(pretrained=True)

整体效果

# 我们这里还是对MNIST进行处理，初始的MNIST是 28 * 28，我们把它处理成 96 * 96 的torch.Tensor的格式
from torchvision import transforms as transforms
import torchvision
from torch.utils.data import DataLoader
 
# 图像预处理步骤
transform = transforms.Compose([
    transforms.Resize(96), # 缩放到 96 * 96 大小
    transforms.ToTensor(),
    transforms.Normalize((0.5), (0.5)) # 归一化
])
 
DOWNLOAD = True
BATCH_SIZE = 32
 
train_dataset = torchvision.datasets.MNIST(root='./data/', train=True, transform=transform, download=DOWNLOAD)
 
 
train_loader = DataLoader(dataset=train_dataset,
                          batch_size=BATCH_SIZE,
                          shuffle=True)
 
print(len(train_dataset))
print(len(train_loader))