带你入门多目标跟踪（一）领域概述

最新推荐文章于 2024-07-31 16:49:23 发布

夜空骑士

最新推荐文章于 2024-07-31 16:49:23 发布

阅读量1.5w

点赞数 27

分类专栏：目标检测跟踪计算机视觉文章标签：多目标跟踪 MOT 目标跟踪

本文链接：https://blog.csdn.net/NIeson2012/article/details/94471642

版权

本文引导读者入门多目标跟踪（MOT），介绍了MOT的基本概念、应用场景，以及在线与离线跟踪的区别。核心在于数据关联策略，如基于检测的TBD与无需检测器的DFT，并探讨了评价指标MOTA。文章还定义了轨迹、轨迹段和ID切换等术语，为后续的算法讨论奠定基础。

摘要由CSDN通过智能技术生成

现在从目标检测和单目标跟踪方向转来做多目标跟踪的小伙伴应该有不少，但由于多目标跟踪任务本身的复杂性，导致其入门会比目标检测与单目标跟踪困难不少。再加上论文分布在各个会议，开源代码较少，都造成了多目标跟踪的研究门槛较高。本文旨在带领大家入门多目标跟踪，了解多目标跟踪领域的发展概况，让大家更方便直观地理解这个问题。

1. 简介

多目标跟踪，即MOT（Multi-Object Tracking），顾名思义，就是在一段视频中同时跟踪多个目标。MOT主要应用场景是安防监控和自动驾驶等，这些场景中我们往往需要对众多目标同时进行追踪。这是仅用目标检测算法或单目标跟踪算法都无法做到的，人们就自然就开始了对多目标跟踪算法的。

DuKeMTMCT数据集，是一个典型的多目标跟踪场景

而由于是多目标，自然就会产生新目标进入与旧目标消失的问题，这就是与单目标跟踪算法区别最大的一点。而由于这一点区别，也就导致跟踪策略的不同。在单目标跟踪中，我们往往会使用给定的初始框，在后续视频帧中对初始框内的物体进行位置预测。而多目标跟踪算法，大部分都是不考虑初始框的，原因就是上面的目标消失与产生问题。取而代之，在多目标跟踪领域常用的跟踪策略是TBD（Tracking-by-Detecton），又或者也可叫DBT（Detection-Based-Tracki