滴普技术荟：基于机器视觉的典型多目标追踪算法应用实践

滴普科技

于 2020-12-01 15:41:21 发布

阅读量970

点赞数

文章标签：算法大数据计算机视觉机器学习

本文链接：https://blog.csdn.net/Deepexi_Date/article/details/110433240

版权

本文介绍了机器视觉中的多目标追踪算法，包括基于检测的MOT、在线与离线跟踪，以及常见评价标准。重点探讨了遮挡、轨迹匹配等难点，并对比了Sort、Deep Sort、FairMot和Graphnn-Mot算法，强调了FairMot的速度和精度优势。实际项目中，目标检测精度对追踪效果影响显著。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

视频目标追踪算法是机器视觉中一项很实用重要的算法，视频目标追踪算法应用场景很广，比如智能监控、机器人视觉系统、虚拟现实（人体跟踪）、医学诊断（细胞状态跟踪）等。本文由滴普科技2048团队AI产品部算法工程师朱晓丽介绍基于机器视觉的典型多目标追踪算法应用实践。

概述

目标追踪算法分为单目标追踪SOT（Single-Object Track）和多目标追踪MOT(Multi-Object Track)【1】【2】。在单目标跟踪中，使用给定的初始目标位置，在后续视频帧中对给定的物体进行位置预测。而多目标跟踪算法，大部分都是不考虑初始目标位置的，目标可自行消失与产生。对目前小组项目而言只需用到MOT，所以本文提到的追踪默认为MOT。

1. MOT的分类
(1)TBD(Tracking-by-Detection)与DFT（Detection-Free Tracking）也即基于检测的多目标跟踪与基于目标外形的先验知识无需检测器的多目标跟踪。TBD是目前学界业界研究的主流。
(2)传统的跟踪方式有在线跟踪(Online)与离线跟踪(Offline)两种。在线跟踪算法中，只能使用当前帧及之前帧的信息来进行当前帧的跟踪。而在离线跟踪算法中则没有了这个限制，对每一帧的预测，都可以使用整个视频的信息，这样更容易获得一个全局最优解。两种方式各有优劣，一般视应用场合而定，离线跟踪算法的效果一般会优于在线跟踪算法。而介于这两者之间，还有一种称之为接近在线的多目标跟踪算法（NOMT），即可以部分利用未来帧的信息。

在跟踪结果可修改性方面，在线跟踪是不允许修改以往的跟踪结果的。因为一旦修改，算法自然就不再符合在线跟踪原则，从而不能利用未来帧，进而变成了Near-Online或者Offline的跟踪方式。

需要特别注意，在线跟踪不等于Real-Time实时跟踪，实时跟踪一定属于在线跟踪的，但绝大部分在线跟踪算法速度还太慢，不足以支持实时处理的要求. 尤其是应用了深度学习的算法，往往需要大量运算，对实时处理有较大压力。

2. MOT常用评价标准

在这里插入图片描述