github上用pillow库实现的非官方ImageNet, CIFAR 10 和 SVHN 的自动增广
AutoAugment 算法为一些最著名的计算机视觉数据集找到了增强策略,当将这些策略结合到神经网络的训练中时,可以达到最优的准确性
自动增广
数据增强背后的想法很简单:图像具有许多对称性,变化后不会改变图像中存在的信息。mixup方法在训练期间将图像叠加在一起来获得增强后的数据,从而提高神经网络性能。
自动增广(AutoAugment)是一种为计算机视觉数据集设计的自定义数据增强策略的自动方法。如:水平/垂直翻转图像、旋转图像、更改图像颜色等。不仅可以预测要组合哪些图像变换,还可以预测所使用变换的每个图像的概率和幅度,因此图像并不以相同的方式处理。
AutoAugment 根据运行的数据集学习不同的转换。例如,对于涉及门牌号街景的图像(SVHN) 包括数字的自然场景图像,AutoAugment 专注于几何变换,如剪切和平移,它们代表了该数据集中常见的失真。此外,考虑到世界上不同建筑和门牌号材料的多样性,AutoAugment 已经学会了完全反转原始 SVHN 数据集中出现的自然颜色。
在 CIFAR-10 和 ImageNet 上,AutoAugment 不使用剪切,因为这些数据集通常不包含剪切对象,也不会完全反转颜色,这些转换会导致不真实的图像。相反,AutoAugment 会稍微调整颜色和色调分布,同时保留一般颜色。
这表明 CIFAR-10 和 ImageNet 中对象的实际颜色很重要,而在 SVHN 上只有相对颜色很重要。
词汇
street view of house numbers 街景门牌号(SVHN)