论文笔记:DeepSORT
1.简介
这是ICIP2017的一篇经典多目标跟踪的论文。本篇论文基于SORT改进,通过加入深度特征来减少ID Switch,实现了更高的跟踪指标,并在GTX 1050上实现了20Hz的处理速度。
2.动机
之前的SORT算法虽然速度很快,但是由于在跟踪过程中只使用了尺度和位置信息,导致在位置不确定性很大时(比如遮挡),非常容易出现ID Switch的情况。因此本文引入了深度特征,来解决这个问题。
3.方法
3.1 状态表示
每条跟踪轨迹的状态表示为 ( u , v , γ , h , x ˙ , y ˙ , γ ˙ , h ˙ ) (u,\ v,\ \gamma,\ h,\dot{x},\dot{y},\dot{\gamma},\dot{h}) (u, v, γ, h,x˙,y˙,γ˙,h˙),其中 ( u , v , γ , h ) (u,\ v,\ \gamma,\ h) (u, v, γ, h)表示目标的位置坐标 ( u , v ) (u,\ v) (u, v)和尺寸 ( γ , h ) (\gamma,h) (γ,h)。每一条轨迹保留Amax个age的数据。
3.2 分配问题
跟踪的具体实现通过构建一个检测目标与跟踪目标对应匹配的跟踪问题来实现,分配算法同样选用匈牙利算法。
为了融合运动信息和外观(深度特征)信息,文章提出了两个距离,分别用马氏距离表示运动信息和余弦距离表示外观。计算公式如下:
运动信息:
d ( 1 ) ( i , j ) = ( d j − y i ) T S i − 1 ( d j − y i ) d^{(1)}(i,\ j)=(\pmb{d}_{j}-\pmb{y}_{i})^{\text{T}}\pmb{S}_{i}^{-1}(\pmb{d}_{j}-\pmb{y}_{i}) d(1)(i, j)=(