RASNet阅读笔记:Learning Attentions: Residual Attentional Siamese Network for High Performance Online Vis

CVPR2018 论文在此
文章全称:Learning Attentions: Residual Attentional Siamese Network for High Performance Online Visual Tracking
论文作者在知乎也进行了详细的介绍:https://zhuanlan.zhihu.com/p/34222060

  • RASNet使用三个attention机制对SiamFC特征的空间和channel进行加权,分解特征提取和判别性分析的耦合,用来提升判别能力。

##摘要
最近目标跟踪中通过离线训练的方式来平衡跟踪的精度和速度,显示出了巨大的潜力。然而在在线跟踪中,离线训练出的模型很难适应不同的跟踪目标。作者提出了残差注意力孪生网络(Residual Attentional Siamese Network),简称RASNet,用来高性能的目标跟踪。这个网络模型在孪生网络的框架下重新建立相关滤波器,并且引入了几种不同的注意力机制来适应模型,而不是通过模型的在线更新。也就是说,通过利用离线训练好的general attention,residual attention和channel attention这三个注意力模型,RASNet不仅能够减小深度网络训练中的过拟合问题,还能够提高网络的判别能力和自适应力。作者提出的网络可以端到端训练,充分利用了跟踪序列丰富的时空信息来获得鲁棒的视觉跟踪。作者在最新的两个评价基准上进行实验,OTB2015和VOT2017,表明了RASNet跟踪器有着优越的精度,并且速度超过了80fps。

作者基于SiameseFC结构,提出了新的网络结构如下:

这里写图片描述

最终响应,也就是weighted cross correlation function,如下:
f p ′ , q ′ = ∑ i = 0 m − 1 ∑ j = 0 n − 1 ∑ c = 0 d − 1 γ i , j , c ϕ i , j , c ( z ) ϕ p ′ + i , q ′ + j , c ( x ) + b f_{p',q'}=\sum_{i=0}^{m-1}\sum_{j=0}^{n-1}\sum_{c=0}^{d-1}\gamma _{i,j,c}\phi _{i,j,c}(z )\phi _{p'+i,q'+j,c}( x )+b fp,q=i=0m1j=0n1c=0d1γi,j,cϕi,j,c(z)ϕp+i,q+j,c(x)+b

本文的关键就是这个 γ i , j , c \gamma _{i,j,c} γi,j,c
γ i , j , c = ( ρ ˉ i , j + ρ ~ i , j ) β c \gamma _{i,j,c}=(\bar{\rho }_{i,j}+\tilde{\rho}_{i,j} )\beta _c γi,j,c=(ρˉi,j+ρ~i,j)βc

ρ ˉ i , j \bar{\rho }_{i,j} ρˉi,j是general attention,通过学习生成一个类似于高斯框的东东,表征目标的空间信息,一幅图像不同位置的所表达的重要性不同:
这里写图片描述

$\tilde{\rho}{i,j} 是 r e s i d u a l a t t e n t i o n , 沙 漏 结 构 , 与 是residual attention,沙漏结构,与 residualattention\bar{\rho }{i,j}$合称dual attention,residual attention表征目标的语义信息,增加了判别性。
这里写图片描述
β c \beta _c βc是channel attention,通过池化、MLP,最后sigmoid输出通道权重。不同通道的重要性也不一样,表征的是目标的通道信息。

其实channel attention和general attention所用的方法在跟踪中都很常见,本文的亮点在于作者加入的这个residual attention

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值