这是2016CVPR收录的
在此之前,目标追踪一般都是online的,在这里引入了深度学习offline的训练,他提出了一种思想:similarity learning
他有三大contribution:
- 首先在速度上可以实现实时检测
- 通过一个范本来定位想要的被追踪物体(detection物体为卷积核,卷积下一帧的feature map)
- 使用了全卷积网络
他的 缺点:
- 如果物体size变化太大时效果不太好
- 如果有一堆相似的目标混在一起,效果不好,容易追岔
- 如果物体视觉上发生了变化,如:关照改变,部分遮挡,物体形变,则效果不好
思路
function
它通过function f ( z , x ) f(z,x) f(z,x)来学习第一帧detection到的物体和接下来几帧图片之间的关系,如果相似则score大,反之则score小。这里我们使用了deep conv-net来作为这个function。也就是将gt提取feature map,把feature map作为卷积核来卷积下一帧图片的feature map: f ( z , x ) = g ( ϕ ( z ) , ϕ ( x ) ) f(z, x) = g(ϕ(z), ϕ(x)) f(z,x)=g(ϕ(z),