SimpleTrack-图森3D Track新论文

Abstract:

 近年来,3D 多目标跟踪 (MOT) 见证了许多新颖的基准测试和方法,尤其在tracking-by-detection范式下的基准测试和方法。尽管它们取得了进步和适用性,但尚无法对其优缺点进行深入分析。在本文中,我们将当前的 3D MOT 方法分解为四个组成部分:检测预处理、数据关联、运动模型和生命周期管理,将它们总结为一个统一的框架。然后我们将现有算法的失败案例归因于每个组件并详细研究它们。基于这些分析,我们提出了相应的改进,从而产生了一个强大而简单的基线:SimpleTrack。 在Waymo 开放数据集和 nuScenes 上的综合实验结果表明,我们的最终方法可以通过微小的修改获得最新的最新结果。
此外,我们采取了额外的步骤并重新思考当前的基准测试是否真实地反映了算法应对现实世界挑战的能力。我们深入研究了现有基准的细节,并发现了一些有趣的事实。最后,我们分析了 SimpleTrack 中剩余失败点的分布和原因,并为 3D MOT 提出了未来的方向。

3D MOT Pipeline:

论文将当前基于tracking-by-detection范式的3D MOT方法分解为四个模块:检测预处理、运动模型、数据关联和生命周期管理四个部分,详细分析每个部分的优缺点以及进行相应的改进。

 3D MOT的整个pipeline如上图所示,接下来将分别介绍4个模块的分析及改进:

1.Pre-processing of Input Detections:

先说结论:使用更严格的NMS代替得分阈值过滤检测,这种预处理效果更好

针对检测器输出的检测框,3D MOT的方法经常采用预测得分来过滤低质量的检测,但是这种方式会因为过滤掉某些视场位置较差区域的目标,典型的遮挡物体,从而不利于召回,损害AMOTA指标。因此本文使用更严格的NMS操作代替得分阈值过滤的方法,具体提升如下表:

 

2.Motion Model:

先说结论:使用卡尔曼滤波模型预测物体运动状态

运动模型被用来预测已跟踪物体在下一帧的位置状态,常用的3D MOT运动模型有两种:

1)卡尔曼滤波KF,优势在于它可以利用多帧信息为低质量检测物体提供更平滑的位置结果

2)匀速模型CV,凭借明确的速度预测可以更好地处理突然和不可预测的运动

结果对比如下表:

 KF和CV模型在WOD和nuScenes数据集上表现各有胜负,其中KF模型在WOD上的优势主要来自对目标检测框的细化。为了验证这一点,论文使用KF-PD方法,也就是仅仅使用KF做运动预测来进行数据关联,不对目标检测框进行细化,可以看出,效果与KF有差距。CV模型在nuScenes上的优势是由于该数据集帧率较低,CV运动模型更合适。最终论文采用KF模型预测

3.Association:

先说结论:使用3D GIOU度量方式+匈牙利匹配或贪婪匹配均可

数据关联是MOT任务中很重要的一个环节,主要包括关联指标计算(衡量当前帧检测目标和跟踪物体之间的距离)和匹配策略(通过计算的距离将检测和跟踪匹配)

1)Association Metrics:

检测和跟踪之间的关联指标主要分为IOU-based和distance-based两种,前者是衡量检测和跟踪目标之间的重叠率,但是简单的IOU对于没有重叠的两个目标,将会导致关联失效。后者主要是计算检测和跟踪目标之间的马氏距离和L2距离,这种方式不够灵活,也就是阈值不好确定,范围比较广,上图的例子也可以说明。因此,本文提出使用3D GIOU的方式,既可以解决不重叠目标的计算,也可以避免不够灵活的问题。下图具体显示了4种关联指标的性能。

 

2)Matching Strategies:

Matching 策略,主要有两种:

1.二分匹配问题,匈牙利匹配算法

2.贪婪匹配,迭代关联最近的pairs

本文发现:

iou-based两种都适合
distance-based适合贪婪匹配

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值