Learning Discriminative Model Prediction for Tracking --- 论文翻译

最新推荐文章于 2022-12-01 14:02:38 发布

听我的错不了

最新推荐文章于 2022-12-01 14:02:38 发布

阅读量1.4k

点赞数

分类专栏：学习日常文献翻译目标跟踪

本文链接：https://blog.csdn.net/weixin_45032769/article/details/103898697

版权

学习日常同时被 3 个专栏收录

70 篇文章 1 订阅

订阅专栏

文献翻译

47 篇文章 3 订阅

订阅专栏

目标跟踪

27 篇文章 0 订阅

订阅专栏

这是CVPR2019上一篇单目标跟踪的文章,效果特别好.
虽然现在研究的是siam系列,但是翻译一下,以后学习用得到

Abstract

目前，端到端可训练计算机视觉系统的发展给视觉跟踪带来了巨大的挑战。与大多数其他视觉问题相比，跟踪需要在推理阶段在线学习一个robust的目标特定的外观模型。为了实现端到端可训练，目标模型的在线学习需要嵌入到跟踪体系结构中。由于这些困难，流行的Siamese只是简单地预测一个目标特性模板。但是，由于该模型不能对背景信息进行整合，因此其识别能力有限。 ⇒ 整合了背景信息
我们开发了一个端到端跟踪架构，能够充分利用目标和背景外观信息进行目标模型预测。我们的体系结构是通过设计一个专门的优化过程而产生的，这个优化过程能够在仅仅几次迭代中预测一个强大的模型。此外，我们的方法是能够学习关键方面的区别性损失本身。该跟踪器在6个跟踪基准上设置了最新的技术水平，在VOT2018上获得了0.440的EAO分数，同时运行速度超过40 FPS。

Introduction

一般目标跟踪是在视频序列的每一帧中估计任意目标的状态。在最一般的设置中，目标仅由其在序列中的初始状态定义。目前的大多数方法是通过建立一个目标模型来解决跟踪问题，该模型能够区分目标和背景外观。由于特定于目标的信息只在测试时可用，因此无法在并行训练阶段(如实例对象检测)学习目标模型。相反，目标模型必须在推理阶段通过利用测试时给出的目标信息来构建。这种非常规的视觉跟踪问题的性质带来了重大的挑战，当追求一个最终的学习解决方案。
在这里插入图片描述

图1所示 目标模型提供的置信图的可视化，使用i)基于暹罗的方法(中)和ii)我们的鉴别方法(右)获得。红色框表示每个图像中的目标对象(左)。该模型以暹罗式的方式预测，仅使用目标的外观，努力区分目标和背景中的干扰物。相比之下，我们的方法产生的目标模型具有较强的识别能力，对背景干扰具有较强的鲁棒性。

上述问题在Siamese中得到了最成功的解决[34,1,21]。这些方法首先学习一个特征嵌入，其中两个图像区域之间的相似性是通过简单的互相关计算出来的。然后通过找到与目标模板最相似的图像区域来执行跟踪。在这个设置中，目标模型简单地对应于从目标区域中提取的模板特征。因此，跟踪器可以很容易地使用带注释的图像对进行端到端的训练。
尽管最近取得了成功，暹罗语学习框架仍然存在严重的局限性。首先，Siamese跟踪器在推断模型时只利用目标外观。这完全忽略了背景的外观信息，这对于区分目标和场景中相似的物体是至关重要的(见图1)。其次，对于离线训练集中没有包含的物体，学习的相似度度量不一定可靠，导致泛化能力差。第三，暹罗公式没有提供强大的模型更新策略。相反，最先进的方法诉诸于简单的模板平均[40]。与其他先进的跟踪方法相比，这些限制导致[18]的鲁棒性较差。
在这项工作中，我们引入了一个可选的跟踪架构，以端到端方式进行培训，直接解决了所有上述的限制。在我们的设计中，我们的灵感来自于最近的跟踪器中已经成功应用的鉴别学习过程[26,7,4]。我们的方法是基于一个目标模型预测网络，它是由一个有区别的学习损失通过应用迭代优化程序得到的。该体系结构经过精心设计，能够实现有效的端到端培训，同时最大限度地提高预测模型的识别能力。这是通过通过两个关键的设计选择来确保最少的优化步骤来实现的。首先，我们采用基于最陡下降的方法来计算每次迭代的最优步长。其次，我们集成了一个有效初始化目标模型的模块。此外，通过学习识别性损失本身，我们将显著的灵活性引入到我们的最终架构中。
我们的整个鉴别跟踪体系结构，连同主干特征提取器，都使用带注释的跟踪序列进行训练，以最小化未来帧上的预测误差。我们在七个跟踪基准上进行了全面的实验:NFS[9]、UAV123[24]、OTB100[37]、TrackingNet[25]、LaSOT[8]、GOT10k[13]和VOT2018[18]。我们的方法在所有七个数据集上都达到了最先进的结果，同时运行速度超过40帧/秒。我们进一步提供了一个广泛的实验分析的建议的区别学习架构，显示了每个组件的影响。

2. Related Work

听我的错不了

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Learning Discriminative Model Prediction for Tracking --- 论文翻译

这是CVPR2019上一篇单目标跟踪的文章,效果特别好.虽然现在研究的是siam系列,但是翻译一下,以后学习用得到Abstract目前，端到端可训练计算机视觉系统的发展给视觉跟踪带来了巨大的挑战。与大多数其他视觉问题相比，跟踪需要在推理阶段在线学习一个robust的目标特定的外观模型。为了实现端到端可训练，目标模型的在线学习需要嵌入到跟踪体系结构中。由于这些困难，流行的Siamese只是简单...
复制链接

扫一扫

专栏目录