[论文阅读 2018 CVPR 目标跟踪]High Performance Visual Tracking with Siamese Region Proposal Network-CSDN博客

本文链接：https://blog.csdn.net/qq_39621037/article/details/114711340

简介

paper:High Performance Visual Tracking with Siamese Region Proposal Network
code:SiamRPN

这篇论文提出了SiamRPN跟踪算法，论文最大的亮点就是将RPN引入了跟踪任务中。

在当时，很多相关滤波加深度网络的跟踪算法虽然在精度上有了很大提升，但实时性很差。对此，siamfc为代表的siamese network跟踪算法兼顾了精度和速度。

这篇论文在SiamFc的基础上，将RPN加入到其中，取得了当时的速度的SOTA.

RPN简介

RPN是目标检测领域中用于生成候选框的一种算法，相比于传统的候选域生成算法，该算法速度快且可以很好地融入到深度网络中进行训练，在Faster Rcnn中首次提出并发挥了重要作用。

关于RPN的介绍可以参考RPN 解析

主要思想

在这里插入图片描述

SiamRPN的主要框架如上图所示，可以分为Siamese Network和Region Proposal Network两个部分，其中Siamese Network部分共享网络参数，而Region Proposal Network部分又分为Classification Branch和Regression Branch.

Classification Branch输出的是一个17*17*2K的向量，其中K是预先设定的anchor的数量；共有k组score,每组score表示每个anchor的positive和negtive概率。

Regression Branch输出的是一个17*17*4K的向量，也分为K组position,每组position表示回归得到的dx、dy、dw、dh。

可以知道，每一个anchor都对应一组{positive score,negtive score,dx,dy,dw,dh}，最终跟踪的时候从所有由anchor得到的目标框中分数最高的，并经过线性插值后得到当前帧的跟踪框.

整个跟踪模型需要优先下列函数：

$\min _{W} \frac{1}{n} \sum_{i=1}^{n} \mathcal{L}\left(\zeta\left(\varphi\left(x_{i} ; W\right) ; \varphi\left(z_{i} ; W\right)\right), \ell_{i}\right)$

let $z$ denote for the template patch, $x$ for the detection patch, function $φ$ for the Siamese feature extraction subnetwork and function $ζ$ for the region proposal subnetwork.