不是做细粒度方向的,这里只是简单补充一点直觉知识,不深究 Mixup+CutMix 两种经典的图像增广方式(下图说明一切) 看图的直观感觉: Mixup的问题根本就是凑出一个四不像,语义上没有什么含义,这样凑出的样本真的有意义吗? CutMix,加了狗图像的那一小块,根本就无关痛痒,并没有给整个图像的识别增加太大难度 SnapMix 针对细粒度图像分类的一种图像增广方法,主要动机是细粒度图像分类比较关注细节,而上面两种方式可能正好就会覆盖掉关键细节,从而生成无效的训练图片