GAIN论文解读 Tell Me Where to Look: Guided Attention Inference Network

GAIN论文提出了一种改进的训练方法,使网络在识别物体时能更准确地聚焦目标。通过弱监督和全监督学习,解决网络在识别时注意力分散的问题,提高attention map的质量,尤其在语义分割任务上表现优越。
摘要由CSDN通过智能技术生成

简介

这篇论文是依据Ramprasaath R. Selvaraju的Grad-CAM:Visual Explanations from Deep Networks via Gradient-based Localization的论文来写的。Grad-CAM这篇文章展示出卷积神经网络的识别方式和人的识别方式有着异曲同工之妙。如图1所示,当识别狗时,网络会将“注意力”放在狗身上,同样的当识别猫时,网络会将“注意力”放在猫身上。详情可参见文献1、2。

图一

但是GAIN的作者发现了一个问题,那就是在识别某些物体的时候,网络容易会将“注意力”放在和所要识别的物体相关的东西上,而不会将“注意力”放在物体本身上。如图2所示,可以看出,网络在识别船的时候,却把“注意力”放在了水面上。


图二

针对于本问题,作者提出了一种新的训练方式,通过在最小化原图像识别损失函数的同时来最小化遮挡住待识别物体的图像的识别分数来训练整个网络,训练后的网络能够更好的将“注意力”放在待识别的物体上。

guided attention inference networks(gain)工作方式


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值