论文阅读：Attentive CutMix

最新推荐文章于 2022-08-10 19:07:58 发布

Z字君

最新推荐文章于 2022-08-10 19:07:58 发布

阅读量899

点赞数 1

分类专栏： # mix 文章标签：计算机视觉

本文链接：https://blog.csdn.net/zzc_zhuyu/article/details/116933799

版权

5 篇文章 0 订阅

订阅专栏

Attentive CutMix: An Enhanced Data Augmentation Approach for Deep Learning Based Image Classification

之前的区域丢弃方法（cutout、cutmix等）通过部分遮挡对象的区分部分来促进网络更好地泛化，但都随机丢弃，而没有捕获对象中最重要的区域。本文提出了Attentive CutMix，训练过程中基于来自特征提取器的中间注意力图来选择最具描述性的区域，搜索图像中最具区别性的部分。

图1比较了涉及到的相关策略：

本文的动机：**之前的区域丢弃策略都是随机选择区域，但是最具区别性的部分可能有更好的效果。**为此，在CutMix基础上增加了注意力机制，也就是本文的Attentive CutMix方法。

数据增广

CutMix

将一个图像中的块随机剪切并粘贴到另一个图像上，同时将真实标签按块大小成比例地混合在一起

注意力机制

本文介绍了一种简单的基于注意力的区域选择，可以在空间上找出最有区别的部分。

$\tilde{x}=\mathbf{B}\odot x_1+(\mathbf1-\mathbf{B}\odot x_2)\\ \tilde{y}=\lambda{y_1}+(1-\lambda)y_2$

$\mathbf{B}$ 是二进制掩模。

Attentive CutMix不是随机选择块，而是借助预训练网络确定图像中最具区分性的区域。这项技术的有效性与预训练模型直接相关。

Attentive CutMix通过使用注意力消除随机性使图像融合更加健壮，在块选择和粘贴两方面得到了改善。

top6可以取得最佳平均性能，6个以下不能为第二张图像中的对象提供足够的遮挡，6个以上可能会给图像中的对象提供过多的遮挡。

方法的缺点是：除了要训练的实际网络之外，还需要预训练的特征提取器。但是，根据分类任务以及模型和数据集的训练复杂性，可以更改在数据增强中使用的预训练提取器的大小。

算法很简单，在cutmix基础上加了注意力块。但是还是没有解决标签构造的问题。将图A中最有区别性的区域放到了图B中，但是标签还是按照面积占比进行计算，感觉是不合理的。而且，生成的图像不会像图2中那么好，高响应的位置往往集中在一起。

关注