基于PyTorch学AI——Transforms转换

上一节了解了Dataset提到transform属性和target_transform属性,本节具体看看它的使用场景。

机器学习或深度学习算法一般对数据有比较严格的要求,而训练数据往往是不稳定的,会有各种变化,因此多数情况下都需要对训练数据进行"变形"才能喂给算法。
transform和target_transform属性既用来指定变形方法。

在这里插入图片描述

Transforms转换的用途

Dataset有两个参数——transform和target_transform,分别指定用于处理数据和标签的方法。
torchvision.transforms模块提供了几种常用的开箱即用的transforms转换函数。
这里的transforms与Transformer算法没什么关系。

例如,FashionMNIST数据集采用PIL图像格式,标签为整数。
训练前,需要将特征进行归一化,并将标签转为one-hot编码,这个需求可以使用ToTensor和Lambda实现。

import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

ToTensor

ToTensor方法将PIL图像或NumPy ndarray转换为FloatTensor类型,并在[0.,1.]范围内实现数据归一化。

Lambda

使用用户自定义的Lambda表达式将整数转换为一个one-hot张量。
首先创建一个长度为10,类型为torch.float的全0张量,并调用scatter_方法,用于在标签y给出的索引上分配赋值1,从而完成one-hot张量的构建。

总结

本节很简单,只需要知道两个Transforms转换有什么用途。
实际项目中,该方法几乎都需要自定义,使训练数据满足算法要求。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值