TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised Object Localization
TS-CAM:用于弱监督目标定位的令牌语义耦合注意图1.摘要:弱监督对象定位(WSOL)是一个具有挑战性的问题,当给定图像类别标签时,需要学习对象定位模型。优化卷积神经网络(CNN)进行分类,倾向于激活局部区分区域,而忽略完整的对象范围,导致部分激活问题。在本文中,我们认为部分激活是由CNN的内在特征引起的,其中卷积操作产生局部接受域,并难以捕获像素之间的长程特征依赖性。我们引入了令牌语义耦合注意图(TS-CAM),以充分利用视觉转换器中的自注意机制进行长程依赖性提取。TS-CAM首先将图像分割成一
原创
2021-11-03 17:38:23 ·
1452 阅读 ·
0 评论