2018年的VOT竞赛结果已出,基于深度特征(Deep Feature)的相关滤波依旧强势,但值得注意的是,基于孪生网络(Siamese Network)的方法异军突起,在主赛上有不俗表现的同时,在实时赛与长时跟踪赛上取得了几乎垄断的绝对优势。
先解释一下SiamRPN与DaSiamRPN
SiamRPN(High Performance Visual Tracking with Siamese Region Proposal Network)是发表于CVPR2018上的论文,而DaSiamRPN(Distractor-aware Siamese Networks for Visual Object Tracking)则是对SiamRPN的改进版。
目录
4、Proposal selection 候选区域的选择策略
1、概述
我们先从SiamRPN开始说起,这套算法的思路是利用Siamese孪生网络分别提取初始帧目标与待检测帧图像的特征,二者提取的特征经过Region Proposal Network(RPN,区域候选网络),输出候选区域是目标的概率及其与位置大小有关的相对偏移量(非绝对量),进一步筛选处理后,得到最终目标位置与边界框。
如果你了解牛津Joao F. Henrique等人出的(SiameseFC)Fully-Convolutional Siamese Networks for Object Tracking以及目标检测领域的Faster RCNN的话,就很容易理解这篇论文了。
当然,不了解也没关系,配合我之后写的代码解读,也可以理解SiamRPN~~
首先看一下运行跟踪时网络总体结构图ÿ