DAT(NIPS 2018)视频目标跟踪论文笔记

1. 论文基本信息


2. 概述

论文通过在深度学习损失函数中引入注意力正则(attention regularization),并且利用reciprocative learning进行反向传播训练得到attention map,该attention map会影响跟踪过程中产生的classification score,从而实现更加鲁棒的跟踪算法。


3. 研究动机

(1) 有的跟踪算法采用固定形态的空间加权作为注意力机制,不够灵活,难以适应目标的显著运动。

传统采用了视觉注意力的跟踪方法,有些采用了某种特定形态的空间加权(e.g. CF2采用的cosine窗函数,SRDCF采用高斯函数),这一类方法往往给予中央区域更高的权重,为周边区域分配较低的权重,这里以SRDCF为例,其空间加权如下图所示(注: SRDCF里面用的是惩罚权重,因此plot中的数值越高的部分表示惩罚越大):
在这里插入图片描述

可以推测,在这种注意力机制下,在目标物体发生显著位移时会影响跟踪的效果(因为目标如果发生显著位移,会出现在采样区域的边缘,权重降低后容易被跟踪器标记为背景信息)。

(2) 有的跟踪算法利用附加的注意力模块来实现单一视频帧的特征加权,难以实现时间维度上的鲁棒性。

举例,STAMHART跟踪算法就采用了额外的注意力模块来生成特征权重,然而,这些权重都是基于单帧视频(通常都用current frame)画面学习得到的,在目标物体的运动过程中,它们难以集中到稳定、鲁棒的信息上来。并且,如果特征加权中出现了少量偏差,就有可能导致分类错误。


4. 提出的方法

不同于现有的注意模型利用附加模块来生成注意力数据,论文作者使用网络输出关于输入图像的偏导数作为注意力图。论文使用attention map作为training阶段的正则项,使分类器学习到对外观变化具有鲁棒性的区域(这部分区域就是注意力)。在测试过程中,论文直接使用深度网络输出的得分来定位目标对象。论文的总体结构如下图所示:
在这里插入图片描述

论文提出的方法总体上可以分为四个步骤

  1. 输入一幅training图像,首先通过前向传播计算classification score。
  2. 根据上述classification score,利用反向传播计算关于输入图像偏导数的方式,得到attention map(此反向传播不更新网络参数,仅仅只是为了得到attention map)。
  3. 将上述attention map作为深度网络损失函数正则项,迭代训练深度网络(此反向传播更新网络参数)。
  4. 在testing阶段,直接利用上述迭代训练好的深度网络作正向传播,进行目标物体定位。

4.1 Attention Exploitation(对应总体步骤1 - 2)

CNN网络的前向传播,可以用一阶泰勒展开(first-order Taylor expansion)进行描述,如下所示:
(1) f c ( I ) ≈ A c ⊤ I + B {f_c}\left( I \right) \approx A_c^ \top I + B \tag {1} fc(I)AcI+B(1)
其中, I I I表示输入的图像, c c c表示某一特定的类别class, f c {f_c} fc表示CNN网络输出,其含义是:输入图像属于类别 c c c的可能性。 A c ⊤ A_c^ \top Ac表示网络相对于输入 I I I的梯度, B B B表示偏置。对于 A c ⊤ A_c^ \top Ac,它可以表示为:
(2) A c = ∂ f c ( I ) ∂ I ∣ I = I 0 {A_c} = {\left. {\frac{ {\partial {f_c}\left( I \right)}}{ {\partial I}}} \right|_{I = {I_0}}} \tag {2} Ac=Ifc(I)I=I0(2)

从公式(1)可以看出:

  1. 输入 I I I的类别 c c c得分受 A c A_c Ac元素值的影响。
  2. A c A_c Ac内部的元素值表明输入图像 I 0 I_0 I0的相应像素对最终类别得分的贡献度(输入图像目标区域的贡献度高,背景区域的贡献度低)。

这样,我们就可以 A c A_c Ac看做是一个attention map。并且从 A c A_c Ac的定义可知,对于不同的输入图像,其值是特定的。

根据公式(2),论文通过计算输出

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值