GlobalTrack 笔记

最新推荐文章于 2023-03-29 22:08:10 发布

木木JL

最新推荐文章于 2023-03-29 22:08:10 发布

阅读量2.7k

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/qq_35078996/article/details/106166967

版权

GlobalTrack : A Simple and Strong Baseline for Long-term Tracking

https://arxiv.org/abs/1912.08531 link

长期跟踪的一个关键在于更大的区域（通常是整个图像）中搜索目标，以应对目标丢失。作者提出GlobalTrack进行全局实例搜索的跟踪器；GlobalTrack基于two-stage的目标检测器，根据单个查询图像作为指导，对任意实例进行全图像和多尺度搜索。最重要的是不需要在线学习，也不需要对位置或尺度变化进行惩罚，无需尺度平滑。
在这里插入图片描述
基于Faster-RCNN的思路，GlobalTrack包含两个子模块：用于生成query-specific候选对象的query-guided区域生成网络（QG-RPN），以及对候选对象进行分类的query-guided区域卷积神经网络（QG-RCNN）并产生最终的预测。
GlobalTrack的总体架构：在这里插入图片描述
在QG-RPN和QG-RCNN的特征调制部分中，对backbone和ROI输出的查询和搜索图像特征之间的相关性进行编码，指导检测器定位到query-specific的实例。

在跟踪过程中，将QG-RCNN的top-1预测作为结果。在训练阶段，使用与Faster-RCNN中相同的分类和定位损失，作者进一步提出了一种交叉查询损失，以提高GlobalTrack针对干扰物/相似物的鲁棒性，把同一图像上不同查询的损失平均化，迫使模型学习查询与预测结果之间的依赖性。

Query-guided RPN：

QG-RPN是为了得到与目标相关的候选区域，关键是利用相关性在backbone特征中对查询信息进行编码。 $z\in R^{k \times k \times c}$ 表示查询实例的ROI特征， $x\in R^{h\times w \times c}$ 表示搜索图像特征，其中h，w和k代表特征尺寸；目的是获得一个 $\hat{x} \in R^{h\times w\times c}$ ，用于编码z和x之间的相关性：
$\hat{x}=g_{qg-rpn}\left(z,x\right)=f_{out}\left(f_x\left(x\right)\otimes f_z\left(z\right)\right)$

⊗表示卷积， $f_z\left(z\right)$ 是把z转换为卷积核，该卷积核在特征 $f_x\left(x\right)$ 上生成z与x之间的相关性。 $f_{out}$ 用于确保输出 $\hat{x}$ 具有与x相同的大小。 $f_z$ 是零填充的k×k卷积层，将z转换为1×1的卷积核， $f_x$ 是具有填充的3×3卷积层，而 $f_{out}$ 是 1×1卷积层，把特征通道数变回c。这部分不使用归一化和激活函数。
由于 $\hat{x}$

最低0.47元/天解锁文章

木木JL

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
7
评论
GlobalTrack 笔记

GlobalTrack : A Simple and Strong Baseline for Long-term Trackinghttps://arxiv.org/abs/1912.08531 link长期跟踪的一个关键在于更大的区域（通常是整个图像）中搜索目标，以应对目标丢失。作者提出GlobalTrack进行全局实例搜索的跟踪器；GlobalTrack基于two-stage的目标检测器，根据单个查询图像作为指导，对任意实例进行全图像和多尺度搜索。最重要的是不需要在线学习，也不需要对位置或尺度变化进
复制链接

扫一扫