Learning Discriminative Model Prediction for Tracking --- 论文翻译

这是CVPR2019上一篇单目标跟踪的文章,效果特别好.
虽然现在研究的是siam系列,但是翻译一下,以后学习用得到

Abstract

目前,端到端可训练计算机视觉系统的发展给视觉跟踪带来了巨大的挑战。与大多数其他视觉问题相比,跟踪需要在推理阶段在线学习一个robust的目标特定的外观模型。为了实现端到端可训练,目标模型的在线学习需要嵌入到跟踪体系结构中。由于这些困难,流行的Siamese只是简单地预测一个目标特性模板。但是,由于该模型不能对背景信息进行整合,因此其识别能力有限。 ⇒ 整合了背景信息
我们开发了一个端到端跟踪架构,能够充分利用目标和背景外观信息进行目标模型预测。我们的体系结构是通过设计一个专门的优化过程而产生的,这个优化过程能够在仅仅几次迭代中预测一个强大的模型。此外,我们的方法是能够学习关键方面的区别性损失本身。该跟踪器在6个跟踪基准上设置了最新的技术水平,在VOT2018上获得了0.440的EAO分数,同时运行速度超过40 FPS。

Introduction

一般目标跟踪是在视频序列的每一帧中估计任意目标的状态。在最一般的设置中,目标仅由其在序列中的初始状态定义。目前的大多数方法是通过建立一个目标模型来解决跟踪问题,该模型能够区分目标和背景外观。由于特定于目标的信息只在测试时可用,因此无法在并行训练阶段(如实例对象检测)学习目标模型。相反,目标模型必须在推理阶段通过利用测试时给出的目标信息来构建。这种非常规的视觉跟踪问题的性质带来了重大的挑战,当追求一个最终的学习解决方案。
在这里插入图片描述

  • 图1所示 目标模型提供的置信图的可视化,使用i)基于暹罗的方法(中)和ii)我们的鉴别方法(右)获得。红色框表示每个图像中的目标对象(左)。该模型以暹罗式的方式预测,仅使用目标的外观,努力区分目标和背景中的干扰物。相比之下,我们的方法产生的目标模型具有较强的识别能力,对背景干扰具有较强的鲁棒性。

上述问题在Siamese中得到了最成功的解决[34,1,21]。这些方法首先学习一个特征嵌入,其中两个图像区域之间的相似性是通过简单的互相关计算出来的。然后通过找到与目标模板最相似的图像区域来执行跟踪。在这个设置中,目标模型简单地对应于从目标区域中提取的模板特征。因此,跟踪器可以很容易地使用带注释的图像对进行端到端的训练。
尽管最近取得了成功,暹罗语学习框架仍然存在严重的局限性。首先,Siamese跟踪器在推断模型时只利用目标外观。这完全忽略了背景的外观信息,这对于区分目标和场景中相似的物体是至关重要的(见图1)。其次,对于离线训练集中没有包含的物体,学习的相似度度量不一定可靠,导致泛化能力差。第三,暹罗公式没有提供强大的模型更新策略。相反,最先进的方法诉诸于简单的模板平均[40]。与其他先进的跟踪方法相比,这些限制导致[18]的鲁棒性较差。
在这项工作中,我们引入了一个可选的跟踪架构,以端到端方式进行培训,直接解决了所有上述的限制。在我们的设计中,我们的灵感来自于最近的跟踪器中已经成功应用的鉴别学习过程[26,7,4]。我们的方法是基于一个目标模型预测网络,它是由一个有区别的学习损失通过应用迭代优化程序得到的。该体系结构经过精心设计,能够实现有效的端到端培训,同时最大限度地提高预测模型的识别能力。这是通过通过两个关键的设计选择来确保最少的优化步骤来实现的。首先,我们采用基于最陡下降的方法来计算每次迭代的最优步长。其次,我们集成了一个有效初始化目标模型的模块。此外,通过学习识别性损失本身,我们将显著的灵活性引入到我们的最终架构中。
我们的整个鉴别跟踪体系结构,连同主干特征提取器,都使用带注释的跟踪序列进行训练,以最小化未来帧上的预测误差。我们在七个跟踪基准上进行了全面的实验:NFS[9]、UAV123[24]、OTB100[37]、TrackingNet[25]、LaSOT[8]、GOT10k[13]和VOT2018[18]。我们的方法在所有七个数据集上都达到了最先进的结果,同时运行速度超过40帧/秒。我们进一步提供了一个广泛的实验分析的建议的区别学习架构,显示了每个组件的影响。

2. Related Work

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值