来自CVPR2018的一篇文章
原文链接:
End-to-end Flow Correlation Tracking with Spatial-temporal Attention
Motivation
作者认为目前的算法大都只考虑了目标在当前帧的表观特征,对帧间信息利用太少,而tracking本身是基于视频序列做的——这无疑是一种浪费,同时也会降低跟踪器的性能。所以作者提出了一种flow correlation tracker 的思想,用光流来利用时序信息。
Contribution
- 提出FlowTrack(main contribution)
- 提出一种空间&时间的注意力策略
Flow Track
主要的网络还是比较简单的,上面的蓝色part是histroical branch(相当于模版分支),前若干帧 i 都和t-1帧做光流,然后用光流warp 第 i 帧的feature,最后把这些warp之后的特征merge到一起,得到一个比较好的特征。
作者这样做的目的是:能够用前 i 帧的特征修补t-1帧的特征。比如,当t-1帧的目标在发生形变或部分遮挡时,t-1的特征可能并不能很好的表征当前的目标&#