点击上方“蓝字”关注我们
作者:张洁
编辑:张婵
什么是多目标跟踪?
多目标跟踪是将视频中每一帧的物体都赋予一个 ID,并且得到每个 ID 的行为轨迹,如下图所示。
从代码的层次考虑,其输入为视频序列,输出为物体的行为轨迹和 ID。从是否有模型上考虑,可以分为 model-free 的方法和 tracking by detection 的方法,其中后者又可以分为离线学习的方法和在线学习的方法。
有多目标跟踪算法就有单目标跟踪方法,不同之处就在于匹配问题。举例说明,如果在前一帧检测到两个物体 a,b,在后一帧检测到两个物体 c,d,怎么知道前一帧的 a 在后一帧所对应的是 c 或者 d 的哪一个物体呢?匹配问题在单目标跟踪领域就不存在,因为前后两帧只存在一个目标。
多目标跟踪的难点
多目标跟踪的难点在于 ID switch。
如下图所示,当骑自行车的人与步行的人相遇的时候,步行的人发生了遮挡。这时对于电脑来说,认为是此 ID 的跟踪已经结束。过了一段时间,步行的人重新出现在了视野,但是电脑会认为是一个新的物体出现,因此赋予一个新的 ID。这种情况下,就发生了 ID 交换,同理当物体被其他物体例如电线杆遮挡时也是一样。因此针对这种 ID 交换的情