Transforms
数据并不总是以训练机器学习算法所需的最终处理形式出现。我们使用transforms来对数据执行一些操作并使其适合训练。
所有 TorchVision datasets都有两个参数: transform
用来修改features和 target_transform
用来修改labels。这两个参数接受包含转换逻辑的可调用对象。torchvision.transforms模块提供了几种开箱即用的常用转换。
FashionMNIST features采用PIL图像格式,labels为整数。对于训练,我们需要将特征作为归一化张量,将标签作为单热编码张量。为了进行这些转换,我们使用ToTensor
和Lambda
。
ToTensor()
ToTensor 将 PIL 图像或 NumPy 转换ndarray
为FloatTensor
. 并在 [0., 1.] 范围内缩放图像的像素强度值
Lambda Transforms
Lambda 转换应用任何用户定义的 lambda 函数。在这里,我们定义一个函数,这个函数的功能是将整数转换为 one-hot encoded tensor。它首先创建一个大小为 10(the number of labels in our dataset)的零张量,并调用 scatter_,它在 label 给定的索引上将value=1
分配y
。
target_transform = Lambda(lambda y: torch.zeros(
10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))