论文笔记SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks

最新推荐文章于 2024-05-04 13:45:18 发布

YSQ是我的

最新推荐文章于 2024-05-04 13:45:18 发布

阅读量585

点赞数

分类专栏： # 目标跟踪文章标签：论文笔记目标跟踪孪生网络

本文链接：https://blog.csdn.net/u011609063/article/details/106256545

版权

目标跟踪专栏收录该内容

19 篇文章 1 订阅

订阅专栏

Siamese Instance Search for Tracking论文笔记

1. 论文标题及来源
2. 拟解决问题
3. 解决方法
4. 实验结果
5. 总结

1. 论文标题及来源

SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks, CVPR, 2019.
下载地址：http://openaccess.thecvf.com/content_CVPR_2019/papers/Li_SiamRPN_Evolution_of_Siamese_Visual_Tracking_With_Very_Deep_Networks_CVPR_2019_paper.pdf

2. 拟解决问题

a. 网络加深，缺少平移等变性
b. SiamRPN中存在的中心偏移问题

3. 解决方法

3.1 算法流程

在这里插入图片描述
该算法的骨干网络是ResNet，作者使用来自Conv3-3，Conv4-6和Conv5_3的特征。左图是算法网络结构，右图是SirameseRPN的网络结构。
算法流程
a. 从数据集中提取target和search region
b. 将target和search region分别输入到骨干网络中提取特征
c. 将conv3-3，conv4-6，conv5_3的特征分别输入到SiameseRPN中进行分类和回归，得到分类得分和回归偏移量
d. 将三个SiameseRPN输出的分类得分和回归偏移通过赋予一定的权重，并相加，得到最终的分类得分和回归偏移
d. 根据最终的分类得分和回归偏移得到下一帧target的位置

SiameseRPN
此处可以参考SiameseRPN，和SiameseRPN 不同的是：
a. 此处的adj_1, adj_2, adj_3, adj_4不共享权重
b. 将SiameseRPN中的Up-Channel Cross Correlation Layer换成Depth-wise Cross Correlation
Up-Channel Cross Correlation Layer和Depth-wise Cross Correlation将在后章节介绍

3.2 孪生网络存在问题及解决

a. 根据卷积的定义，卷积过程具有平移不变性，但实际上，每次卷积都会增加padding，而增加的padding会破坏卷积平移不变性；然而如果不增加padding，随着网络深度的加深，特征图的大小会逐渐趋向0。
b. 分类分支和回归分支需要非对称特征

作者认为增加padding会导致spatial bias，为了证明这个结论，作者进行了偏移实验，结果如下
在这里插入图片描述
shit表示偏移。
a. 当没有偏移时，边界区域的置信度会突变为0
b. 当增加偏移时，会阻止模型陷入这种情况
为了解决上述问题a，作者提出spatial aware sampling strategy，并通过如下实验证明其效果

从上图可以发现，当随机偏移64个像素时，它的效果最好，这可能是因为增加随机扰动能够更接近目标的位置分布。

对于问题b，作者使用非共享权重的conv解决

3.3 Depth-wise Cross Correlation

在这里插入图片描述
在孪生网络中，存在不同的Cross Correlation，例如SiamFC使用的Cross Correlation如上图a所示，SiamRPN使用的Cross Correlation如上图b所示，本文使用的Cross Correlation如上图c所示。
作者分析发现在RPN中，上述Cross Correlation方式约有20M参数，但是特征提取器中大概只有4M参数，这会导致参数分布不平衡，从而导致SiamRPN很难优化。
为了解决这种分布不平衡，作者提出Depth-wise Cross Correlation。它按照通道卷积，大幅减少参数，提高算法速度。
通过这种方式会使某一类别由特定的通道输出，而其余的通道会受到抑制

3.4 主要公式说明

a. 特征融合
$S_{all} = \sum^5_{l = 3} \alpha_i * S_l, \ \ \ B_{all} = \sum^5_{l = 3} \beta_i * B_l$
$S_{all}$ 表示融合后的分类得分， $B_{all}$ 表示融合后的回归偏移

4. 实验结果

4.1 消融实验

在这里插入图片描述

4.2 VOT2018

在这里插入图片描述

4.3 OTB2015

在这里插入图片描述

4.4 VOT2018 long-term

在这里插入图片描述

4.5 UAV123

在这里插入图片描述

4.6 LaSOT

在这里插入图片描述

4.7 TrackingNet

在这里插入图片描述

5. 总结

该算法在SiamRPN的基础上，通过引入spatial aware采样策略(随机偏移)缓解平移不变性问题，增加网络深度，提升算法效果。OTB2015的AUC和Precision分别是0.696和0.914；VOT2018的EAO, Accuracy, Robustness, AO分别是0.414，0.6, 0.234，0.498；VOT2018(long term)的F-score是0.629；UAV123的AUC和Precision分别是0.613和0.807；LaSOT的AUC和 $P_{norm}$ 分别是0.496和0.569；TrackingNet的AUC，P和 $P_{norm}$ 分别是0733，0.694，0.8

YSQ是我的

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
论文笔记SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks

Siamese Instance Search for Tracking论文笔记1. 论文标题及来源2. 拟解决问题3. 解决方法3.1 算法流程3.2 孪生网络存在问题及解决3.3 Depth-wise Cross Correlation3.4 主要公式说明4. 实验结果4.1 消融实验4.2 VOT20184.3 OTB20154.4 VOT2018 long-term4.5 UAV1234.6 LaSOT4.7 TrackingNet5. 总结1. 论文标题及来源SiamRPN++: Evolut
复制链接

扫一扫