pytorch文档

小坏蛋Chris

已于 2023-04-03 17:21:44 修改

阅读量178

点赞数

文章标签：计算机视觉 python

于 2023-03-18 11:03:19 首次发布

本文链接：https://blog.csdn.net/qq_51966222/article/details/129624042

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章介绍了深度学习中图像预处理的步骤，包括使用PIL库进行图像处理，以及torchvision的DataLoader和预训练模型加载。以CIFAR10数据集为例，展示了如何使用torchvision进行数据加载和归一化，以及训练卷积神经网络的过程。

摘要由CSDN通过智能技术生成

请添加图片描述

图像预处理步骤

transform = transforms.Compose([
transforms.Resize(96), # 缩放到 96 * 96 大小
transforms.ToTensor(), # 转化为Tensor
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) # 归一化
])

Data loader

dataloader = torch.utils.data.DataLoader(
dataset=mnist, batch_size=batch_size, shuffle=True)
也可以通过使用 pretrained=True 来加载一个别人预训练好的模型

导入训练好的模型
import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
alexnet = models.alexnet(pretrained=True)

1.PIL库概述
PIL（Python Image Library）库是Python语言的第三方库，需要通过pip工具安装。安装PIL库的方法如下，需要注意，安装库的名字是pillow。
Image.format 标识图像格式或来源，如果图像不是从文件读取，值为None
Image.mode 图像的色彩模式，"L"为灰度图像、"RGB”为真彩色图像、"CMYK”为出版图像
Image.size 图像蜜度和高度，单位是像素（px），返回值是二元元组（tuple）
Image.palette 调色板属性，返回一个ImagePalette类型
————————————————
PIL库主要可以实现图像归档和图像处理两方面动能需求
（1）图像归档：对图像进行批处理、生成图像预览、图像格式转换等。
（2）图像处理：图像基本处理、像素处理、颜色处理等。

torchvision

通常来说，当你处理图像，文本，语音或者视频数据时，你可以使用标准 python 包将数据加载成 numpy 数组格式，然后将这个数组转换成 torch.*Tensor

对于图像，可以用 Pillow，OpenCV
对于语音，可以用 scipy，librosa
对于文本，可以直接用 Python 或 Cython 基础数据加载模块，或者用 NLTK 和 SpaCy
特别是对于视觉，我们已经创建了一个叫做 totchvision 的包，该包含有支持加载类似Imagenet，CIFAR10，MNIST 等公共数据集的数据加载模块 torchvision.datasets 和支持加载图像数据数据转换模块 torch.utils.data.DataLoader。

训练一个图像分类器
我们将按次序的做如下几步：

使用torchvision加载并且归一化CIFAR10的训练和测试数据集
定义一个卷积神经网络
定义一个损失函数
在训练样本数据上训练网络
在测试样本数据上测试网络
加载并归一化 CIFAR10 使用 torchvision ,用它来加载 CIFAR10 数据非常简单。

import torch
import torchvision
import torchvision.transforms as transforms
torchvision 数据集的输出是范围在[0,1]之间的 PILImage，我们将他们转换成归一化范围为[-1,1]之间的张量 Tensors。