目标跟踪论文阅读笔记（一）Learning regression and veriﬁcation networks for long-term visual tracking

melody96313

于 2018-11-06 20:29:58 发布

阅读量1.1k

点赞数

分类专栏：深度学习目标跟踪

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/melody96313/article/details/83793739

版权

深度学习同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

这一篇又是大连理工卢湖川教授团队的论文，所以我觉得应该质量挺高的，所以今天来阅读一下。

针对的是长期跟踪，经常会出现目标消失的情况（这个在短期跟踪里基本没有），然后又有可能重现回到视野内。

本文提出了的算法将一个基于匹配思想的回归网络V（通用的匹配函数，类似于siamfc）和分类网络R协同起来，回归网络主要来生成一些概率比较大（得分高）的候选区域，这个网络需要去学习到鲁棒，可以抵抗目标形变的特征表达，而分类网来确定目标是否已经丢失。

当候选区域在V中的匹配分数和在R中的目标置信度得分不能同时达到较高的分值时，就被判定为目标丢失，这时候要在整张图片中搜索。

（其实之前我也有想过增加一个跟踪置信度的变量，只是想在原有的孪生网络上增加一个分类分支，没想到要重新去训练一个分类网。而且我设置这个置信度是为了进一步的目标特征融合，加入更多的时间信息。而这里，置信度主要是为了去除复杂、相似背景的干扰）

回归网络R的结构

前面和siamfc很类似，用同一个网络（Mobile net，这个网络的效率比较高，适合跟踪这种实时任务）分别提取目标和搜索区域（目标区域的四倍大）的特征，但是两个分支网络的参数是不同的。搜索区域提取的特征是两个尺度的，为了适应目标的尺度变化。另外，更重要的是，siamfc直接用卷积层来代替匹配函数，而这里，将两个分支的特征融合，再通过一个RPN网络，输出一些候选区域（回归值）。最后，在所得的候选区域中，需要用到非最大值抑制这个算法去去除一些冗余的区域，IOU的阈值为0.6.

特征融合的细节，如图所示：

识别分类网络V的结构

输入一个107*107的候选区域，输出两个神经元，分别是目标和背景的概率。

受MDNet的启示，该网络的后三层权值是在线更新的，能更好地去区分特定目标和背景。

这篇文章其实是跟踪和目标检测SSD，RPN的一个结合，精准度很高。

算法的不足：太慢了，在NVIDIA GTXTITAN X上的FPS仅为2.主要原因是：

有两个网络，提取的特征应该是有很大程度上的冗余；

RPN的计算量又特别大，还包含了多尺度；

在候选区域丢失目标后，需要在整张图通过滑窗操作来寻找目标的位置，特别费时；

分类网络V类似于MDNet，采用一种在线更新的机制。

所以在算法速度上，还可以采取很多优化的措施。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
目标跟踪论文阅读笔记（一）Learning regression and veriﬁcation networks for long-term visual tracking

这一篇又是大连理工卢湖川教授团队的论文，所以我觉得应该质量挺高的，所以今天来阅读一下。针对的是长期跟踪，经常会出现目标消失的情况（这个在短期跟踪里基本没有），然后又有可能重现回到视野内。本文提出了的算法将一个基于匹配思想的回归网络V（通用的匹配函数，类似于siamfc）和分类网络R协同起来，回归网络主要来生成一些概率比较大（得分高）的候选区域，这个网络需要去学习到鲁棒，可以抵抗目标形变的特...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。