目标跟踪SiamRPN阅读笔记

转生成为海绵宝宝

已于 2022-08-24 17:29:28 修改

阅读量371

点赞数 1

文章标签：目标跟踪深度学习人工智能

于 2022-08-24 17:18:33 首次发布

原文链接：http://openaccess.thecvf.com/content_cvpr_2018/papers/Li_High_Performance_Visual_CVPR_2018_paper.pdf

版权

1网络整体结构

网络由两部分组成：孪生网络用于特征提取，区域生成网络（RPN）用于候选框的生成。RPN由两个分支组成，其中分类分支用于区分前景和背景，回归分支用于对候选框进行微调（平移缩放之类）使最终boundingbox更准确。（对照于目标检测中RPN的应用，先分类再微调）

2孪生特征提取子网络

孪生网络双分支分别提取模板图像（z）和当前检测图像（x），双分支共用参数，提取的特征表示为φ（z）、φ（x）。

3区域生成子网络

包含两个分支，前景-背景分类和区域生成。

RPN：生成候选框，分为两个部分，achor机制和bounding box regression

Achor机制：图像经过特征提取操作生成特征图，以图上每一个点作为中心点下锚，也就是生成矩形框，假设k个锚，就生成k种类型的框。

Bounding box regression：给每一个框都有一个评分，给每个点上最接近ground truth的框进行微调，（平移，或者调整框的大小，这通过一个线性回归模型实现）使这个框更接近真实框。

假设有k个锚点，分类输出2k个通道，回归需要输出4k个通道。因此网络通过卷积层将φ（z）增加成两个分支[φ（z）]cls和[φ（z）]reg分别用于分类和回归，并且通道数上是2k和4k倍。φ（x）也被分成两个分支[φ（x）]cls和[φ（x）]reg但通道数不变。

每个分支中[φ（z）]相当于[φ（x）]的卷积核，还是以群的形式，应该是对应通道的进行卷积

在Acls中的每个点是2k通道的向量，代表着在原图相应位置的正、负激活，同时也用softmax loss进行监督。同样的在Areg中每个点包含4k通道的向量，代表dx，dy，dw，dh，他们表示生成的锚与一个标准点的距离。

4 one-shot detection

对比两幅图可以看到，相当于孪生网络提取模板图像特征作为卷积核（相当于w的作用），回归就是通过提取的卷积核对当前待检测图像进行筛选，然后与标签比较，计算距离，最小化这个差距。模板分支被训练用于预测局部检测认务的卷积核。

5训练推理过程

训练阶段只需要成对的检测框

推理阶段除了第一帧的时候，只留下检测分支，能够保持快速（模板不变）

转生成为海绵宝宝

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
目标跟踪SiamRPN阅读笔记

目标跟踪阅读笔记，主要翻译了SiamRPN的2、3、4模块
复制链接

扫一扫

转生成为海绵宝宝 CSDN认证博客专家 CSDN认证企业博客

码龄4年

2: 原创

165万+: 周排名

197万+: 总排名

1950: 访问

: 等级

35: 积分

1: 粉丝

3: 获赞

3: 评论

2: 收藏

私信

关注

热门文章

最新评论

pycharm使用：debug过程中突然不显示变量的形状
CSDN-Ada助手: 非常感谢您的分享，您的经验对我们这些刚开始学习编程的人来说非常有帮助。希望您能够继续写出更多的博客，分享更多的学习经验和技巧。此外，关于Pycharm的调试功能，您还可以尝试使用条件断点、watch表达式等功能来进一步提高调试效率。再次感谢您的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
目标跟踪SiamRPN阅读笔记
［渔民］: 哇，学到了学到了，感谢博主！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。