学习论文:Bridging the Gap Between Detection and Tracking: A Unified Approach
动机:本文希望探索一种在几乎任何先进的目标检测器上直接构建跟踪器的一般框架。
提出该动机的原因有3个方面:1)检测算法是专门在复杂场景中精确定位和区分对象的,这可能导致更准确和稳健的跟踪器。
2)重用检测模型可以减少跟踪中的重复工作,因此我们可以将更多精力放在跟踪特定的问题上,例如目标域适应和时间依赖性。
3)这种框架有可能促成多任务模型,即联合检测和跟踪视觉物体, 这接近行业的需求。
需要解决的问题:1)目标检测器是特定于类别的,而跟踪器是与类别无关的,即应该跟踪任意移动的对象。2)目标检测器无法区分类内实例,但这是跟踪器的一项关键能力。3)时间线索对于稳定的长期追踪很重要,而在静止图像检测器中不考虑它们。
一、框架架构
我们将跟踪看作为one-shot目标检测和few-shot实例分类的联合任务。前者是类等级子任务找到所有类似目标候选框,而后者是一种实例级子任务,它从干扰物中区分出目标。