行人跟踪POI论文中Online tracker方法理解
论文POI: Multiple Object Tracking with High Performance Detection and Appearance Feature提出的Online tracker和offline tracker两种方法在2016 MOT数据集上实现了较好的性能,本博客学习了Online tracker方法。
Online tracker方法:高性能的行人检测+提取外观特征进行匹配追踪
行人追踪可以分为2部分:
(1)行人检测:该部分使用faster-rcnn检测行人,得到行人的检测框boxes
(2)追踪:过程如下图
- 用GoogleNet对行人区域提取特征appearance features,训练该模型的loss有两部分,softmax loss(保证特征的可区分性)和triplet loss(保证同一个人的appearance features 之间的相似度高)
- 计算检测到的区域detection与跟踪集tracklets里的行人之间的密切程度,即affinity。它可以分为3个部分:appearance affinity,motion affinity,shape affinity:
因此,可以得到密切度矩阵:
- 对tracklets中的每一个track计算它的追踪质量指标,通过阈值
τt
τ
t
,将跟踪集
Tt−1
T
t
−
1
分为高质量跟踪集
Tt−1high
T
h
i
g
h
t
−
1
和低质量跟踪集
Tt−1low
T
l
o
w
t
−
1
。
下面是计算track的跟踪质量的公式,不能理解!!!
- 通过Kuhn-Munkres算法找D与T之间的最优匹配。通过阈值
τa
τ
a
,判断是否匹配成功。先匹配
Tt−1high
T
h
i
g
h
t
−
1
和D,再匹配
(Tt−1high−Tt−1success)∪Tt−1low ( T h i g h t − 1 − T s u c c e s s t − 1 ) ∪ T l o w t − 1 和 D−Dsuccess D − D s u c c e s s 。得到 (Tt−1successi,Dtsuccessi),Tt−1fail,Dtfail ( T s u c c e s s i t − 1 , D s u c c e s s i t ) , T f a i l t − 1 , D f a i l t 。 - 更新跟踪集tracklets。更新可以分为3部分:
Tt1=Average(Tt−1successi,Dtsuccessi) T 1 t = A v e r a g e ( T s u c c e s s i t − 1 , D s u c c e s s i t ) ,就是匹配成功的detections;
Tt2=PredictOrRemove(Tt−1fail,τm) T 2 t = P r e d i c t O r R e m o v e ( T f a i l t − 1 , τ m ) ,若连续 τm τ m 帧,tracklets中的track都没有与D匹配上,就可以删掉;
Tt3=Initialize(Dtfail) T 3 t = I n i t i a l i z e ( D f a i l t ) ,就是新出现的行人;
因此, Ttcandidate=Tt1∪Tt2∪Tt3 T c a n d i d a t e t = T 1 t ∪ T 2 t ∪ T 3 t