论文链接:AutoAugment: Learning Augmentation Strategies from Data
CVPR 2019
论文设计了自动搜索数据增强策略的方法。在限定的数据增强的搜索空间中采样出数据增强policy。根据policy对图像进行变换后输入训练 ,把验证集的acc作为reward信息反馈给增强学习算法,不断交互,获取最好效果的policy。
(1)直接在数据集上搜索
(2)policy迁移到其他数据集也有效(将imagenet policy迁移到FGVC、Stanford Cars 和 FGVC Aircraft)
论文:从数据中学习数据增强策略的方法原则上可以用于任何数据集,而不仅仅是一个数据集。
搜索算法
增强学习controller RNN:有30 softmax predictions,controller使用policy gradient更新。controller RNN:一层100 个隐藏单元的LSTM,对两个卷积层2 × 5B个预测(B通常是5)
训练算法: PPO
采样增强策略: S S S, S S S包含图像处理的操作、在每个batch使用操作的概率以及操作的程度。使用 S