论文笔记Learning to Track at 100 FPS with Deep Regression Networks
1. 论文标题及来源
Learning to Track at 100 FPS with Deep Regression Networks, ECCV, 2016.
下载地址:https://davheld.github.io/GOTURN/GOTURN.pdf
2. 拟解决问题
a. 大多数方法在线训练模型,未充分利用数据集
3. 解决方法
3.1 算法流程
a. 从上一帧中裁剪出target
b. 以上一帧target的中心为search region的中心,search region的高和宽都是target的2倍
c. 使用卷积网络分别提取他们的特征,然后输入到FC层直接回归目标的位置,即输出目标在当前帧的位置
FC层的目的是为了比较object的特征和当前帧的特征,以找到object被移动到了哪里。FC层学习到的是一个复杂的特征比较函数,输出目标的相对运动。
4. 实验结果
4.1 VOT2014
4.2 消融实验
6. 总结
该算法流程非常简单,通过卷积网络提取特征,然后使用FC学习一个复杂的特征比较函数,最后直接输出目标在当前帧的位置