【论文阅读】[VAC] Visual Attention Consistency under Image Transforms for Multi-Label Image Classification

最新推荐文章于 2022-06-22 09:41:29 发布

yepoyou

最新推荐文章于 2022-06-22 09:41:29 发布

阅读量446

点赞数 1

分类专栏：多标签识别 # 神经网络 # 深度学习文章标签： cnn 深度学习人工智能

原文链接：https://www.pianshen.com/article/6563763612/

版权

13 篇文章 2 订阅

订阅专栏

13 篇文章 1 订阅

订阅专栏

7 篇文章 1 订阅

订阅专栏

概述

图像变化下的注意力一致性在多标签图像分类下的应用。
本文使用很简单的方法利用class attention map（CAM）使用一个称作Attention consistency loss 的无监督的损失函数来进行不变性的约束。
具有强可解释性，并且也达到了很好的效果

人类的视觉感知对图像的变换（旋转、缩放、反转等）具有很强的不变性，而这种不变性在CNNs中是有缺陷的。作者希望网络也有这种作用
本文提出了data augumentation（数据增广）的一个缺陷，我对它的理解是：图像的一些变换（如旋转）应该是比较渐层能学习到的，但是在一般使用数据增广的策略中，都只是使用最后loss来对这种变换进行学习。作者认为这是不合理的。
related study并没有很好的解决consistency的问题

输入两张图片，一张原图，一张经过变换

输出分类结果

using what？

关注