Motivation:
设计了一个由多层lstm组成的meta-updater,用来控制模板更新从而实现online-updated tracker。
paper:
code:
meta-updater
x
t
∈
R
d
×
1
x_t ∈ R^{d\times 1}
xt∈Rd×1 is a column vector concentrated by
s
t
C
,
s
t
A
,
v
t
R
s^C_t , s^A_t , v^R_t
stC,stA,vtR , and
b
t
b_t
bt.
Appearance Cue:
s
t
A
s^A_t
stA
计算方法:
实现代码:
这里的resnet需要单独通过三元损失和分类损失进行单独训练。
Discriminative Cue: v t R v^R_t vtR
通过一个三层的 conv + max pooling 构成的网络从response map学习到 1x1x8的向量
代码实现:
最后将 bbox的坐标及分类得分concat到一起 形成一个 (t,4+1+1+8) 维的向量输入到lstm中判断是否进行更新