数据来源:
一、MXnet官网 vision.datasets
1、MNIST handwritten digits dataset from http://yann.lecun.com/exdb/mnist
2、A dataset of Zalando’s article images consisting of fashion products,
3、CIFAR10 image classification dataset from https://www.cs.toronto.edu/~kriz/cifar.html
4、CIFAR100 image classification dataset from https://www.cs.toronto.edu/~kriz/cifar.html
5、A dataset wrapping over a RecordIO file containing images.
6、A dataset for loading image files stored in a folder structure.
二、MXnet官网 vision.transforms
1、transforms.Compose 顺序组成多个变换
2、transforms.Cast 将输入转换为特定的数据类型
3、transforms.ToTensor 将图像NDArray或一批图像NDArray转换为张量NDArray
4、transforms.Normalize 用均值和标准差归一化形状为(C xH x W)或(N x C xH x W)的张量
5、transforms.RandomResizedCrop 使用随机比例和宽高比裁剪输入图像
6、transforms.CenterCrop 通过修整所有四个侧面并保留图像的中心,将图像src裁剪为给定的大小
7、transforms.Resize 将一个图像或一批图像NDArray调整为给定大小
8、transforms.RandomFlipLeftRight 从左到右随机翻转输入图像的概率为0.5
9、transforms.RandomFlipTopBottom 将输入图像从上到下随机翻转为0.5
10、transforms.RandomBrightness 随机抖动图像亮度,其因子为[max(0,1-亮度),1 +亮度]
11、transforms.RandomContrast 随机抖动图像对比度,其因子为[max(0,1-对比度),1 +对比度]
12、transforms.RandomSaturation 随机抖动图像饱和度,其因子选自[max(0,1-饱和度),1 +饱和度]
13、transforms.RandomHue 以[max(0,1-hue),1 + hue]中选择的因子随机抖动图像色调
14、transforms.RandomColorJitter 随机抖动图像的亮度,对比度,饱和度和色调
15、transforms.RandomLighting 将AlexNet样式的基于PCA的噪声添加到图像