版权声明:本文为博主原创文章,未经博主允许不得转载。
简介
DSST(Accurate Scale Estimation for Robust Visual Tracking)在2014年VOT上夺得了第一名,算法简洁,性能优异,并且我上一篇所述的KCF夺得了第三名,两者都是基于滤波器的算法,这一年是CF义军突起的一年,值得研究这些相近的优秀算法。这篇算法是基于MOSSE的改进,突出内容是加入了尺度变换,下面开始逐一讲解算法内容。
相关滤波器
首先讲一下MOSSE提出的相关滤波器,从目标中提取一系列的图像patches,记为 f1,f2,...ft 作为训练样本,其对应的滤波器响应值为一个个高斯函数 g1,g2,...gt ,而目的就是找到满足最小均方差(Minimum Output Sum of Squared Error)的最优滤波器:
ε=∑j=1t||ht∗fj−gj||2=1MN||HtFj−Gj||2(1)
其中第二个等号根据Parseval定理导出,等式左侧是空域的方程式,右侧是频域的方程式,正正是这个等式,使得我们将问题求解变换到频域里求解, ε 的最小值在频域里的解如下:
Ht=∑tj=1GjFj∑tj=1FjFj(2)
一般而言, gj 可以是任意形状的输出,这里的输出 gj 是高斯型的函数,峰值位于中心处。这个方法的 技巧或者 目的在于:一是运算简洁,基本都是矩阵运算;二是引入快速傅里叶(FFT)大大加快运算效率。这即是相关滤波器被应用在Tracking并获得较好效果的原因,满足了对速度的一大需求。
在得到上述相关滤波器后,对于新的一帧中的候选输入样本z,求相关得分y:
y=F−1(