DSST基于DCF,特征只有HOG,但排名却在SAMF之前,得益于更加简单精确的尺度方法。
算法的思路是把目标跟踪看成目标中心平移和目标尺度变化两个独立问题,首先用HOG特征的DCF训练平移相关滤波,负责检测目标中心平移,然后用HOG特征的MOSSE(注意区别,不加padding)训练另一个尺度相关滤波,负责检测目标尺度变化,(标配)步长1.02的33个尺度。
尺度滤波器仅需要检测哪个尺度最匹配而无须关心平移情况,所以DSST将特征压缩成一维(没有循环移位),尺度检测的响应图也是一维的(1*33),同时为了减小计算量,DSST将尺度检测图像块全部缩放到512像素以内,所以DSST能精细检测33个尺度变化同时保持可观的帧率(论文中是24FPS)。更新阶段两个滤波器都以固定学习率逐帧更新。DSST转PAMI后的快速改进版本fDSST虽然性能略有下降,帧率达到了54.3FPS。
这是它的操作流程:
1.取出序列中的第一帧和目标boundingbox
2.提取目标位置候选窗口的特征x,变换到傅里叶域xf
3.生成目标位置回归矩阵y,变换到傅里叶域yf
4.生成n个尺度boundingbox
5.对于每个boundingbox,提取对应区域的特征,这样生成n个特征s,将s变