High-Speed Tracking-by-Detection Without Using Image Information
基础知识回顾:
-
IOU:全称交并比(Intersection over union),公式如下:
-
PR-MOTA的含义:代表在不同置信度阈值下,分别求得precision和recall的值,然后根据不同的precision和recall会得到相应的PR-MOTA。
PR-MOTA是沿着PR-MOTA curve的积分,即上图红色阴影部分的面积,公式如下:
Ω ∗ = Ω + + Ω = 1 2 ∫ C ψ ( p , r ) d s \Omega^*=\Omega_++\Omega=\frac{1}{2}\int_C\psi(p,r)ds Ω∗=Ω++Ω=21∫Cψ(p,r)ds
前置条件:
(1)检测精度高
(2)视频帧率高
算法流程:
输入:
D
代
表
检
测
集
合
,
D
0
,
D
1
,
.
.
.
,
D
f
−
1
分
别
代
表
第
0
,
1
,
.
.
.
,
f
−
1
帧
的
检
测
集
合
,
d
0
,
d
1
,
.
.
.
d
N
−
1
分
别
代
表
检
测
的
物
体
。
D代表检测集合,D_0,D_1, ...,D_{f-1}分别代表第0,1,...,f-1帧的检测集合,d_0,d_1,...d_{N-1}分别代表检测的物体。
D代表检测集合,D0,D1,...,Df−1分别代表第0,1,...,f−1帧的检测集合,d0,d1,...dN−1分别代表检测的物体。
初始化:
T
a
=
∅
,
T
f
=
∅
,
T
a
代
表
活
跃
轨
迹
,
即
还
没
有
追
踪
完
毕
,
T
f
代
表
及
已
经
追
踪
结
束
的
轨
迹
。
T_a=\varnothing,T_f=\varnothing,T_a代表活跃轨迹,即还没有追踪完毕,T_f代表及已经追踪结束的轨迹。
Ta=∅,Tf=∅,Ta代表活跃轨迹,即还没有追踪完毕,Tf代表及已经追踪结束的轨迹。
D
=
{
{
d
i
∣
d
i
∈
D
j
,
s
c
o
r
e
(
d
i
)
≥
σ
l
}
∣
D
j
∈
D
}
,
其
中
σ
l
代
表
分
数
阈
值
,
过
滤
掉
分
数
小
于
σ
的
目
标
。
D=\{\{d_i|d_i\in D_j,score(d_i)\geq \sigma_l\}|D_j\in D\},其中\sigma_l代表分数阈值,过滤掉分数小于\sigma的目标。
D={{di∣di∈Dj,score(di)≥σl}∣Dj∈D},其中σl代表分数阈值,过滤掉分数小于σ的目标。
流程:
- 对于一个活跃轨迹 t i t_i ti,选取最后加入活跃轨迹的物体,计算该物体与当前帧物体的IOU,与该物体重合度最大的物体记为 d b e s t d_{best} dbest。
- 如果这个最大的IOU大于设定的阈值 σ I O U \sigma_{IOU} σIOU,把 d b e s t d_{best} dbest加入 t i t_i ti,然后将 d b e s t d_{best} dbest从 D f D_f Df中删除。否则判断轨迹 t i t_i ti中物体的最大分数是否大于等于设定的阈值 σ h \sigma_h σh并且轨迹长度是否大于等于设定的最小长度 t m i n t_{min} tmin,如果两者都满足条件,就将 t i t_i ti从活跃轨迹 T a T_a Ta中加入追踪结束的轨迹 T f T_f Tf。
- 然后将 D f D_f Df中的剩余的物体都视为是一条轨迹的开始,并将其加入到活跃轨迹 T a T_a Ta
- 最后对于每一个活跃轨迹 t i t_i ti,判断是不是满足条件,如果满足就将其加入追踪结束的轨迹 T f T_f Tf。
实验结果:
优点:
- 简单,不需要视觉信息
- 计算成本极低,方便在此基础扩展
缺点:
- 依赖检测器性能
- 依赖帧间变化程度
- 遮挡和漏检会使轨迹中断