摘要
相比传统的短期跟踪,长期跟踪需要应对更多的挑战,也更贴近真实应用场景,但这方面在目前研究进展较为缓慢,因此本文提出一个新的鲁棒的、实时的长时间跟踪框架,该框架中包含一个skimming模块和一个perusal模块。perusal模块包含一个有效的bbox生成器和一个鲁棒的目标验证器,前者产生一系列候选样本框,后者计算每个候选框的置信度分数并选出最优候选框。根据置信度分数可以判断目标在当前帧出现与否,若出现(置信度分数高于设定阈值),直接根据置信度分数进行定位,并决定下一帧采取局部搜索策略;否则,判定目标丢失,下一帧采取全局搜索策略。为了加快全局搜索速度,本文提出一个新的skimming模块从一系列滑动窗口中选出最可能若干候选框,再输入perusal模块进行处理。
背景
目前大多数跟踪算法关注短期跟踪任务,但真实应用场景更多时候需要长期跟踪。前者在跟踪过程中目标始终出现在视野中,只不过可能存在遮挡等挑战使出现的目标不完整;后者在跟踪过程中目标可能频繁出现/消失在视野中,更贴近实际情况,也更具挑战性。一方面,长期跟踪视频序列更长;另一方面,长期跟踪过程中需要判断目标是否出现,因此需要具备目标重检测的能力。
贡献
为了更好地进行长期跟踪,本文提出一个simple yet effective算法:
- 本文提出基于深度网络的“skimming-perusal”框架来