近年来,视觉目标跟踪成为一个非常活跃的研究领域。每年都会提出越来越多的跟踪算法。跟踪在人机交互、自动驾驶汽车、机器人、监控和安全等各种现实问题中有着广泛的应用。本文将回顾跟踪领域的最新的趋势和进展,并基于特征提取方法评估了不同跟踪算法的鲁棒性。我们将跟踪算法大致分为基于相关滤波的跟踪算法(CFTs)和非基于相关滤波的跟踪算法(Non-CFTs)。根据体系结构和跟踪机制,将每个类别进一步划分为不同的类型。最后,对本文的研究进行了总结,提出了一些见解,并指出了视觉目标跟踪领域的未来发展趋势。
A. 相关滤波器
在目标跟踪中,相关滤波器(CF)被用来提高鲁棒性和效率。最初,训练的需求使得CF不适合在线跟踪。近年来,最小输出平方误差和(MOSSE)滤波器[60]的发展,允许有效的自适应训练,改变了这种情况。
MOSSE滤波器的目标是使期望输出与实际输出在傅立叶域中的平方误差之和最小。MOSSE是平均合成精确滤波器(Average Synthetic precision Filter, ASEF)[61]的改进版,ASEF经过离线训练来检测目标。ASEF计算一组精确滤波器的平均值,每个滤波器都是从同一对象的不同训练图像中计算出来的,以得到输出的最佳滤波器。后来,许多最先进的CFT提出了基于MOSSE。
习惯上,设计CF的推理目的是生成背景值低、场景感兴趣区域值高的响应图。其中一种是带Kernal的循环结构[62]跟踪算法,该算法利用目标外观的循环结构,采用核正则化最小二乘法进行训练。
基于cf的跟踪方案在频域内进行计算,以控制计算成本。这些算法的总体架构遵循基于检测的跟踪方法,如图2所示。相关滤波器由序列的初始帧目标位置的裁剪目标patch图像初始化。
在跟踪过程中,使用上一帧的目标估计位置估计目标在新一帧中位置。为了有效地表示目标的外观,采用合适的特征