数据增强方式:
(1)传统数据增强,包括crop,translate,zoom,hue等
(2)GAN(CycleGAN)。生成的图片和真实图片差距较大,损失函数定义为分类偏差。
(3)插值式,SMOTE,MIXUP等算法生成新图片
(4)迁移学习
(5)特征融合,特征手动提取
论文总结:
《The Effectiveness of Data Augmentation in Image Classification using Deep》
本论文设计一个agument网络+classify网络,agument网络随机抽取两张相同类别的图片生成新的图片,然后送进classify网络做分类评判,目标函数是agument loss+classify loss。
当准确率比较高,效果比较好时,数据增强提升不大。分类难度越大,数据越少,使用数据增广提升越明显。
传统数据增强方式还是比较有效的,还有GAN和论文提到的增强方法也比不增强的准确率要高。
使用数据增强后,训练的准确率可能会有所下降,关键是看测试的准确率是否上升。