Fast AutoAugment
更快的图像自动增强
原文:Fast autoaugment
github:Fast autoaugment github
单位: 韩国和加拿大研究人员合作
摘要: 数据增强是改进泛化和处理不平衡数据集的不可或缺的技术。最近,AutoAugment(Cubuk等,2019)已被提出用于从数据集自动搜索增强策略,并且在许多图像识别任务上具有显着改进的性能。但是,它的搜索方法即使在简化设置中也需要数千小时的GPU训练时间。在本文中,我们提出了Fast AutoAugment算法,该算法使用基于密度匹配的更有效的搜索策略来学习增强策略。与AutoAugment相比,所提出的算法可以按照大小的顺序加快搜索时间,同时通过各种模型和数据集(包括CIFAR-10,CIFAR-100和ImageNet)保持图像识别任务的可比性能。
related work
在本文中,我们提出了一种快速有效的增强策略搜索方法,称为快速自动延迟,由贝叶斯Data augment驱动。同时和上文有一定的区别,采用了密度匹配的方式来搜索更好的数据增强策略。
Fast autoaugment
1. 搜索空间
每种操作有两个参数:概率p和幅值lambda。所以每种操作被应用的公式为:
所以一个搜索空间的输出为:
下图是一个图像增强的具体示例:
2. 密度匹配
对于任何给定的Dtrain和Dvalid对,我们的目标是通过搜索与Dtrain密度匹配的增强策略和增强Dvalid的密度来提高泛化能力。但是,直接比较这两个分布以评估每个候选政策是不切实际的。因此,我们通过使用两个数据集上的模型预测来测量一个数据集遵循另一个数据集的数量来执行此评估。详细地说,让我们将Dtrain分成DM和DA,分别用于学习模型参数θ和探索增强策略T