PyTorch深度学习入门笔记(五)Transforms的使用

课程学习笔记,课程链接
学习笔记同步发布在我的个人网站上,欢迎来访查看。

一、Transforms的使用

torchvision中的transforms主要是对图片进行一些变换。
tranforms对应 tranforms.py 文件,里面定义了很多类,输入一个图片对象,返回经过处理的图片对象。
在这里插入图片描述
transforms.py就像一个工具箱,里面定义的各种类就像各种工具,图片就是输入对象,经过工具处理,输出期望的图片结果。
在这里插入图片描述
现在通过 transforms.ToTensor去看两个问题:

  • 1、transforms该如何使用(python)
  • 2、为什么我们需要 Tensor 数据类型
    在这里插入图片描述
    ToTensor功能是将 PIL Image 类型 或者numpy.ndarray类型的图片对象转换为 tensor类型。
    使用Demo:
from torchvision import transforms
from PIL import Image

img_path = "testdata/train/ants_image/6743948_2b8c096dda.jpg"
img = Image.open(img_path)
print(img)
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img)
print(tensor_img)

在这里插入图片描述
所以使用transforms的方法就是 先实例化选中的类,然后用实例化的对象去处理图片就行。
在这里插入图片描述

二、Tensor数据类型

将第一节中的代码复制到 python 控制台,回车,可在右侧看到各种变量和对象的具体信息:
在这里插入图片描述
tensor 数据类型可以理解为包装了反向神经网络一些理论基础参数。在神经网络中,要将数据先转换为Tensor类型,再进行训练。
测试代码:

from torchvision import transforms
from torch.utils.tensorboard import SummaryWriter
from PIL import Image

img_path = "testdata/train/ants_image/6743948_2b8c096dda.jpg"
img = Image.open(img_path)

writer = SummaryWriter("logs")

tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img)

writer.add_image("Tensor_Image",tensor_img)
writer.close()

结果:
在这里插入图片描述

三、常见的Transforms

常用的输入图片对象的数据类型

  • PIL : Image.open()
  • tensor : ToTensor()
  • ndarrays: cv.imread()

常用的Transform有:

  1. ToTensor() :将图片对象类型转为 tensor
  2. Normalize() :对图像像素进行归一化计算
  3. Resize():重新设置 PIL Image的大小,返回也是PIL Image格式
  4. Compose(): 输入为 transforms类型参数的列表,即
Compose([transforms参数1, transforms参数2], ...)

目的是将几个 transforms操作打包成一个,比如要先进行大小调整,然后进行归一化计算,返回tensor类型,则可以将 ToTensor、Normalize、Resize,按操作顺序输入到Compose中。
示例代码:

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
import os

root_path = "hymenoptera_data/train/ants"
img_name = "7759525_1363d24e88.jpg"
img_path = os.path.join(root_path,img_name)
img = Image.open(img_path)

writer = SummaryWriter("logs")

# ToTensor
trans_totensor = transforms.ToTensor() # instantiation
img_tensor = trans_totensor(img)
writer.add_image("Tensor", img_tensor)

# Normalize
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize", img_norm)

#Resize
print(img.size)
trans_resize = transforms.Resize((512,512))
img_resize = trans_resize(img) # return type still is PIL image
img_resize = trans_totensor(img_resize)
writer.add_image("Resize", img_resize)

# Compose - resize -2
trans_resize_2 = transforms.Resize(512)
tran_compose = transforms.Compose([trans_resize_2, trans_totensor])
img_resize2 = tran_compose(img)
writer.add_image("Compose", img_resize2)

writer.close()

结果:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

  • 关注输入和输出类型
  • 多看官方文档
  • 关注方法需要什么参数
  • 13
    点赞
  • 64
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
import torch import torchvision from torchvision import transforms from torchsummary import summary import torch.optim as optim import torch.nn as nn import torch.nn.functional as F import torchvision.datasets as datasets from torch.utils.data import DataLoader 首先,import torch用于导入PyTorch库。PyTorch是一个开源的机器学习框架,提供了用于构建和训练神经网络的工具。导入torch可以使用其提供的各种函数和类来进行深度学习任务。 然后,import torchvision用于导入torchvision库,它是基于PyTorch构建的用于处理图像和视觉数据的库。torchvision包含了一些常用的计算机视觉模型、数据集和数据转换等功能,可以方便地进行图像处理相关的任务。 接着,from torchvision import transforms用于导入transforms模块。transforms模块提供了一些常用的数据转换操作,如图像的裁剪、缩放、旋转、归一化等。这些转换操作可以方便地应用于图像数据,以便于后续的训练和预处理。 最后,from torchsummary import summary,import torch.optim as optim,import torch.nn as nn,import torch.nn.functional as F,import torchvision.datasets as datasets,from torch.utils.data import DataLoader分别用于导入torchsummary库(用于打印模型的概要信息),导入torch.optim(用于优化器的选择和设置),导入torch.nn和torch.nn.functional(用于神经网络的构建和定义不同的激活函数),导入torchvision.datasets(用于加载各种常用的图像数据集),以及从torch.utils.data导入DataLoader(用于数据的加载和生成数据迭代器)。 通过以上的导入语句,我们可以方便地使用PyTorchtorchvision提供的各种功能进行深度学习和计算机视觉任务的开发和实验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雪天鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值