GAIN [CVPR18]

GAIN


paper: Tell Me Where to Look: Guided Attention Inference Network

本文是基于SEC算法进行的改进,在SEC的基础上提升了5个百分点左右。
这篇文章…感觉没有什么创新…其实就是类似对抗擦除的思路,将第一次识别出来的区域进行遮挡,强迫神经网络找出所有能用于识别类别的信息。
结构如下:
在这里插入图片描述

  1. 输入图像 I I I,经过DCNN得到识别的attention maps和类别的置信度。我们希望这个置信度越匹配label越好。
  2. 将识别处的区域进行擦除,对应途中的soft mask操作,将擦除后的图像在送入该网络,得到类别的置信度。我们希望擦除后的图像不在具有类别的信息,所以这里我们希望每个类别的置信度都尽可能小(趋紧于0)。

Classification Loss:预测结果于label的交叉熵。
Attention Mining Loss: L a m = 1 n ∑ c s c ( I ∗ c ) L_{a m}=\frac{1}{n} \sum_{c} s^{c}\left(I^{* c}\right) Lam=n1csc(Ic)

addition

图中获得Attention map的方式是基于Grad-CAM的。
两个loss的权重是相同的。

performance
VOC12 valVOC12 test
55.356.8
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值