DSST简述

引言

  当在复杂图像序列中遇到大的尺度变化时,大多数现有方法会提供较差的性能。因此论文中研究了视觉跟踪中尺度估计的挑战性问题,提出了一种在视觉跟踪中精准的尺度估计的方法:DSST(Discriminatiive Scale Space Tracker)算法。下图是作者给出的算法的效果与其他算法的对比:
在这里插入图片描述

方法

  DSST算法思想:
  (1)一维滤波器用于评估目标的尺度变化,二维滤波器用于评估目标的位置变化,三维滤波器用于详尽的尺度空间中的目标定位
  (2)分为两个相关滤波器——位置滤波器(translation filter)和尺度滤波器(scale filter),分别依次进行目标定位和尺度评估。
  (3)两个滤波器相对独立,从而可以选择不同的特征种类和特征计算方式来训练和测试
考虑输入信号f(图像的某一个patch)具有d维特征描述,为了构造最佳的相关滤波器h,可以通过最小化代价函数得到:
在这里插入图片描述
  其中,上标l表示特征的某一维度,λ是指正则化参数,上式只考虑了一个训练样本,求解得到H为:
在这里插入图片描述
  同样将H拆分为分子A和分母B,分别进行迭代更新,更新的方法如下:
在这里插入图片描述
  其中η表示学习率。对于新来的一帧图像中的图像Patch z,它的响应得分为 y ,计算方法如下:
在这里插入图片描述
  y中最大值的位置被认为是目标新位置的估计。
  作者提出了一种三维的尺度相关滤波器,滤波器的大小为 M x N x S,M和N分别代表滤波器的Height 和Width,S代表尺度的数量。f是以上一帧确定的位置为中心,取得一系列不同尺度的图像块的特征。采用三维高斯函数构建三维的滤波响应输出g。同样采用第三部分叙述的方法每次迭代更新模板h。对于新一帧的图片,可以获取S个尺度上的特征组成一个 M x N x S的特征金字塔z,采用第三部分叙述的方法获得响应g,根据g中最大值所在的位置则可以确定位置信息和尺度信息。
  将尺度估计并入跟踪器会带来更高的计算成本。为了提高计算效率作者,通过将尺度估计和位置分开计算,基于一维相关滤波器,提出了一种快速的尺度估计方法。
  在新的一帧中,先利用二维位置滤波器确定目标的新位置,再利用一维尺度滤波器精确评估当前的尺度,对较大的尺度进行粗检测,对较小的尺度进行细检测。

实验

  实验环境:Intel Xenon 2 core 2.66 GHz CPU with 16 GB RAM。

  (1)在基线代码加了尺度方法前后的对比:
在这里插入图片描述
  (2)与其他state-of-the-art的方法比较:
在这里插入图片描述
  (3)具体序列对比结果(OP为标准)
在这里插入图片描述
  (4)精度-成功率图
在这里插入图片描述
  (5)可视化结果对比:
在这里插入图片描述
  (6)对五个挑战性序列skating1、trellis、soccer、car4和fleetFace的中心位置误差(以像素为单位)进行逐帧比较:
在这里插入图片描述

总结

  本文是基于MOSSE算法,提出了DSST(Discriminatiive Scale Space Tracker)算法,算法的核心部分是实现尺度自适应。作者提出三维滤波器,这个三维我一开始没有明白,但是在几次阅读后,实际上三维是由两部分组成的:一维尺度滤波器;二维位置滤波器。这样就很好理解了,两个滤波器相互独立,这样可以更加的高效,方便于将尺度估计与其他算法相结合。
  DSST将目标跟踪看成目标中心平移和目标尺度变化两个独立问题,先用位置跟踪方法来定位新一帧目标的位置,然后在定位好的这个位置处用训练好的尺度分类器得出新一帧的尺度。同时用新位置和新尺度更新滤波器(分类器)参数。重复这个过程持续跟踪。
  在实验方面,作者在与其他方法的对比中,不仅对于所有序列的平均评价指标进行比对,并且进一步对于5个最好的方法,在28个序列上具体对比,以此看出方法在哪些序列上相比其它方法有显著提升,最后对于5个挑战性的序列进行逐帧比较。

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值