多目标追踪笔记二:关于Tracking By Detecting的多目标跟踪数据关联流程梳理

一、一些预备知识点:关于多目标跟踪的实现方式一般为Tracking By Detecting;

Step1:使用目标检测算法将每帧中感兴趣的目标检测出来,得到对应的(位置坐标, 分类, 可信度),假设检测到的目标数量为M;

Step2:通过某种方式将Step1中的检测结果与上一帧中的检测目标(假设上一帧检测目标数量为N)一一关联起来。换句话说,就是在M*N个Pair中找出最像似的一对组合。

检测算法有很多种,你可以用到目前比较火的深度学习的Faster-RCNN算法来检测目标,也可以使用传统的方法来对多目标进行检测

数据关联方法也有很多种:(数据关联需要把前后两帧的bbox颜色,ID对应起来,不是简单的检测出目标)

1.常见的计算两帧中两个目标之间的欧几里得距离(平面两点之间的直线距离),距离最短就认为是同一个目标,然后通过匈牙利算法找出最匹配的Pair。

2.使用IOU进行计算,如果前后帧的bounding box的交并比接近1,则证明前后两帧的这个检测目标是同一目标,就能关联起来。

 

但单纯利用前后帧的目标检测,然后再将前后帧的检测到的目标进行数据关联会遇到一点问题。

如上图,实线框表示目标在第一帧的位置,虚线框表示目标在第二帧的位置。当目标运行速度比较慢的时候,通过之前的跟踪方式可以很准确的关联(A, A’)和(B, B’)。但是当目标运行速度很快(或者隔帧检测)时,在第二帧中,A就会运动到第一帧中B的位置,而B则运动到其他位置。这个时候使用上面的关联方法(IOU)就会得到错误的结果。

二、所以我们需要解决当目标物体运动时,物体追踪会失败的问题。所以提出来了基于轨迹预测的跟踪方式;

基于轨迹预测的跟踪方式的核心思想是:

使用faster-RCNN(或其他检测算法)检测第一帧的目标-->将检测的目标经过卡尔曼滤波预测下一帧的轨迹状态(u,v,r,h)-->再使用faster-RCNN检测第二帧的目标-->将检测到的第二帧目标与预测的轨迹状态进行配对,(例如如果两者IOU接近1,则代表上帧目标与此帧对应成功)

重复此过程,其中:faster-RCNN用于帧帧检测目标,卡尔曼滤波用于预测。匈牙利算法(或IOU等方法)用于前后帧数据关联。

 

这样再回到之前说过的因为目标前后帧运动过快,导致使用传统的Tracking By Detecting会导致最终匹配失败。但是基于轨迹预测能够很好的解决这个问题,有了这个预测,就能将下一帧预测的目标状态与下一帧的检测出来目标进行对比关联,能够发现我下一帧检测出来的这个目标对应上一帧的目标是哪个;就能将两帧分别检测出来的目标联系起来。

参考:https://blog.csdn.net/ycc2011/article/details/84786924

 

 

  • 16
    点赞
  • 102
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
单目标跟踪数据集: 1. OTB - Object Tracking Benchmark:一个经典的单目标跟踪数据集,包含100个视频序列,涵盖多种对象的形态、尺度、光照、遮挡等变化。 2. VOT - Visual Object Tracking:一个挑战性的单目标跟踪数据集,包含数百个视频序列,涵盖多种场景和对象变化。 3. UAV123 - UAV-based Object Tracking:一个专门针对无人机上的单目标跟踪任务的数据集,包含123个无人机视频序列。 4. LaSOT - Large-scale Single Object Tracking:一个规模较大的单目标跟踪数据集,包含1400个视频序列,涵盖多种场景和对象变化。 5. GOT-10k - Generic Object Tracking Benchmark:一个大规模的通用目标跟踪数据集,包含10,000个视频序列,涵盖多种对象和场景变化。 多目标跟踪数据集: 1. MOTChallenge - Multiple Object Tracking Challenge:一个多目标跟踪竞赛数据集,包含多个子数据集,涵盖多种场景和对象的变化。 2. MOT16、MOT17、MOT20 - Multiple Object Tracking:多个公开的多目标跟踪数据集,涵盖多种场景和对象变化。 3. UA-DETRAC - Urban Autonomous Driving Detection and Tracking:一个专门针对城市自动驾驶场景的多目标跟踪数据集,包含10个城市驾驶场景,涵盖多种车辆和行人的变化。 4. MOT2015 - Multiple Object Tracking:一个多目标跟踪数据集,包含多个子数据集,涵盖多种场景和对象变化。 5. DukeMTMC - Multi-Target, Multi-Camera Tracking:一个多目标多摄像头跟踪数据集,包含多个场景和多个摄像头。
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值