1. 论文基本信息
- 论文标题:Learning Multi-Domain Convolutional Neural Networks for Visual Tracking
- 论文作者:Hyeonseob Nam(Dept. of Computer Science and Engineering, POSTECH, Korea)等人
- 论文出处:CVPR 2016
- 在线阅读:https://arxiv.org/pdf/1510.07945v2.pdf
- 源码链接1:https://github.com/HyeonseobNam/MDNet (MATLAB版本)
- 源码链接2:https://github.com/HyeonseobNam/py-MDNet (Python 3.6版本)
本文的参考代码为上述高亮版本的代码。
2. 网络结构图
论文的详细网络结构如下图所示:
3. 重要变量
MDNet算法在tracking阶段,为了获得更强的鲁棒性,算法采用了检测机制,对不同的情况进行处理。首先看源码中设置的几个关键变量:
- result. 它是一个数组,表示计算出来的目标预定位位置 [ x , y , w i d t h , h e i g h t ] [x, y, width, height] [x,y,width,height]。
- result_bb. 它是一个数组,表示基于上述预定位位置的回归位置 [ x ′ , y ′ , w i d t h ′ , h e i g h t ′ ] [x', y', width', height'] [x′,y