WHAT ARE TRANSFORMS?
训练过程要求数据具备一定的「格式」,比如tensor、input size、augmentation、normalized等要求。因此,在导入 dataset 时都需要指定必须经过的 transform 步骤。We use transforms to perform some manipulation of the data and make it suitable for training.
TorchVision Dataset 有 2 种变换 —— torchvision.transforms :
- transform:modify the features
- target_transform:modify the labels
E.g.
"""
Features: transformed to normalized tensors
Labels: transformed to one-hot encoded tensors
"""
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda
ds = datasets.FashionMNIST(
root="data",
train=True,
download=True,
transform=ToTensor(),
target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)
SPECIFICATIONS
ToTensor()
- 把 PIL image 或 Numpy ndarray 转换成 FloatTensor
- 把图像像素值归一化到 [0, 1]
Lambda
Lamda(首字母大写)是一种特殊的 Transform,能接入任何用户自定义的 lambda(首字母小写) 函数。
以下代码,首先创建了一个 size=5 的全零向量,然后利用 scatter_ 函数在 dim=0 维度上,将 index 位置的元素值换成 value。
import torch
# tensor([0., 0., 0., 0., 0.])
x = torch.zeros(5)
# tensor([0., 2., 0., 0., 0.])
x.scatter_(dim=0, index=torch.tensor(1), value=2)