目标跟踪论文翻译_MJ5513的博客-CSDN博客

目标跟踪论文翻译

关注

文章平均质量分 91

主要是一些自己在目标跟踪方向阅读的文献，仅仅是自己为了记录一下而已

关注数：文章数：22 文章阅读量：53040 文章收藏量：229

作者: MJ5513

这个作者很懒，什么都没留下…

展开

Learning Dynamic Memory Networks for ObjectTracking(论文翻译)

用于目标跟踪的学习动态记忆网络摘要用于视觉跟踪的模板匹配方法由于其相当的性能和快速的速度而得到了广泛的应用。然而，它们缺乏有效的方法来适应目标对象外观的变化，使得它们的跟踪精度仍然远远达不到最先进的水平。在本文中，我们提出了一种动态记忆网络来使模板适应跟踪过程中目标的外观变化。采用LSTM作为存储控制器，输入为搜索特征图，输出为存储块读写过程的控制信号。由于目标在搜索特征图中的位置最初是未知的，因此应用了一种注意力机制来将LSTM输入集中到潜在目标上。为了防止激进的模型自适应，我们应用门限残

原创 2022-09-12 00:41:33 · 1000 阅读 · 1 评论
XMem: Long-Term Video Object Segmentationwith an Atkinson-Shiffrin Memory Model（论文翻译）

X Men：使用 Atkinson-Shiffrin 记忆模型进行长期视频对象分割摘要受Atkinson-Shiffrin记忆模型的启发，我们提出了一种用于长视频的视频对象分割体系结构XMem，它具有统一的特征记忆存储。关于视频对象分割的现有工作通常只使用一种类型的特征记忆。对于长于一分钟的视频，单一功能内存模型将内存消耗和准确性紧密联系在一起。相反，遵循Atkinson-Shiffrin模型，我们开发了一个包含多个独立但深度连接的特征记忆存储的体系结构：快速更新的感觉记忆、高分辨率工作记忆

原创 2022-09-08 23:11:07 · 2784 阅读 · 3 评论
STMTrack: Template-free Visual Tracking with Space-time Memory Networks（STMTrack: 基于时空记忆网络的无模板视觉跟踪）

广泛的实验和比较许多有竞争力的跟踪器在挑战大规模基准，OTB-2015，TrackingNet，GOT-10k，LaSOT，UAV123，和 VOT2018，表明，没有花哨，我们的跟踪器优于所有先进的实时方法，同时运行在37 FPS。我们的时空记忆网络是灵活的，因此在推理过程中使用的记忆帧的数量(即记忆大小)与训练过程中的记忆帧的数量无关(见第4.3节，不同数量的记忆帧在两个阶段对性能的影响)。具体地说，来自第一帧的目标提供最可靠的信息，而来自前一帧的被跟踪目标具有与当前帧中的目标最相似的外观。...

原创 2022-08-30 21:36:07 · 1486 阅读 · 0 评论
Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

MDNet论文翻译

原创 2022-08-10 10:52:58 · 483 阅读 · 0 评论
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows(论文翻译)

摘要本文提出了一种新的视觉转换器，称为Swin Transformer，它可以作为计算机视觉的通用主干。在将Transformer从语言适应到视觉方面的挑战源于这两个领域之间的差异，例如视觉实体的规模差异很大，以及图像中的像素与文本中的文字相比分辨率较高。为了解决这些差异，我们提出了一种分层转换器，其表示是通过移位窗口来计算的。移位窗口方案通过将自我注意计算限制在非重叠的局部窗口，同时还允许跨窗口连接，从而带来了更高的效率。这种分层结构具有在不同尺度上建模的灵活性，并且具有关于图像大小的线性计算复杂性。

原创 2022-05-30 22:49:59 · 629 阅读 · 0 评论
Masked Autoencoders Are Scalable Vision Learners（论文翻译）

摘要本文证明了掩蔽自动编码器(MAE)是一种可伸缩的计算机视觉自监督学习器。我们的MAE方法很简单：我们掩蔽输入图像的随机块并重建丢失的像素。它基于两个核心设计。首先，我们开发了一个非对称编解码器体系结构，编码器只在可见的patch子集上操作(没有掩码tokens)，以及一个轻量级的解码器，它根据潜在的表示和掩码tokens重建原始图像。其次，我们发现，掩蔽高比例的输入图像，例如75%，会产生一个不平凡且有意义的自我监督任务。将这两种设计结合起来，使我们能够高效地训练大型模型：我们将训练...

原创 2022-04-26 22:01:01 · 739 阅读 · 0 评论
Dual Attention Matching Network for Context-Aware Feature Sequence basedPerson Re-Identification（论文）

摘要典型的行人重新识别 (ReID) 方法通常用单个特征向量描述每个行人，并将它们匹配到特定于任务的度量空间中。然而，基于单个特征向量的方法不足以克服视觉模糊，这在现实场景中经常发生。在本文中，我们提出了一种新颖的端到端可训练框架，称为双注意力匹配网络 (DuATM)，用于学习上下文感知特征序列并同时执行注意力序列比较。我们 DuATM 框架的核心组件是双重注意机制，其中序列内和序列间注意策略分别用于特征细化和特征对对齐。因此，可以自动利用和适当比较中间特征序列中包含的详细视觉线索。我们...

原创 2022-04-05 20:51:06 · 4026 阅读 · 0 评论
Dual Attention Network for Scene Segmentation(论文翻译)

paper：https://arxiv.org/abs/1809.02983code：https://github.com/junfu1115/DANet摘要在本文中，我们通过基于自注意力机制捕获丰富的上下文依赖关系来解决场景分割任务。与以前通过多尺度特征融合捕获上下文的工作不同，我们提出了一个双注意力网络 (DANet) 来自适应地将局部特征与其全局依赖关系集成。具体来说，我们在扩张的 FCN 之上附加了两种类型的注意力模块，它们分别对空间和通道维度的语义相互依赖关系进行建模。...

原创 2022-03-27 22:15:41 · 4592 阅读 · 0 评论
Beyond Self-attention: External Attention usingTwo Linear Layers for Visual Tasks（论文翻译）

摘要注意机制，尤其是自我注意，在视觉任务的深度特征表示中发挥了越来越重要的作用。自注意力通过使用所有位置的成对亲和力计算特征的加权和来更新每个位置的特征，以捕获单个样本中的长期依赖关系。然而，self-attention 具有二次复杂度，并且忽略了不同样本之间的潜在相关性。本文提出了一种新的注意力机制，我们称之为外部注意力，它基于两个外部的、小的、可学习的、共享的内存，只需使用两个级联的线性层和两个归一化层就可以轻松实现；它方便地取代了现有流行架构中的 self-attention。外...

原创 2022-03-26 15:52:25 · 5231 阅读 · 1 评论
Learning Multi-Domain Convolutional Neural Networks for Visual Tracking(论文翻译)

用于视觉跟踪的多域卷积神经网络学习算法目录摘要1.引言2.相关工作2.1 视觉跟踪算法2.2 卷积神经网络2.3 多域学习3.多域网络(MDNet)3.1 网络结构3.2 学习算法4.用MDNet在线跟踪4.1跟踪控制和网络更新4.2硬例挖掘4.3 边界框回归4.4 实验细节5.实验5.1 在OTB100上评估5.2对VOT2014数据集的评估6.结论摘要我们提出了一种新的基于判别训练卷积神经网络(C...

原创 2021-12-19 20:57:52 · 552 阅读 · 0 评论
Pyramid Correlation based Deep Hough Votingfor Visual Object Tracking（论文翻译）

摘要现有的基于Siamese的跟踪器大多将跟踪问题视为分类和回归的并行任务。然而，一些研究表明，在网络训练过程中，兄弟头结构可能导致次优解。通过实验我们发现，在没有回归的情况下，只要精心设计网络以适应训练目标，性能同样有希望。提出了一种新的基于投票的纯分类跟踪算法--基于金字塔相关的深度霍夫投票算法(PCDHV)，用于联合定位目标的左上角和右下角。具体地说，我们创新性地构建了金字塔相关模块，为嵌入的特征提供细粒度的局部结构和全局空间上下文；精心设计的Deep Hough Voting模块...

原创 2021-11-28 22:22:04 · 2305 阅读 · 0 评论
Learning Spatio-Temporal Transformer for Visual Tracking（论文翻译）

目录摘要1.引言2.相关工作3.方法3.1 transformer的基准3.2时空transformer跟踪4.实验4.1 实施细节4.2 结果和比较4.3基于组件的分析4.4与其他框架的比较4.5 可视化5.结论摘要本文提出了一种以编码-解码器transformer为关键组件的跟踪体系结构。编码器对目标对象和搜索区域之间的全局时空特征依赖关系进行建模，而解码器学习嵌入的查询以预测目标对象的空间位置。我们的方法将目标跟踪作为一...

原创 2021-11-20 22:19:59 · 3327 阅读 · 0 评论
Learning Discriminative Model Prediction for Tracking（论文翻译）

摘要当前端到端可训练计算机视觉系统的努力对视觉跟踪任务提出了重大挑战。与大多数其他视觉问题不同，跟踪需要在推理阶段在线学习健壮的特定于目标的外观模型。因此，为了端到端可训练，目标模型的在线学习需要嵌入到跟踪体系结构本身中。由于这些挑战，流行的Siamese范例只是简单地预测目标特征模板，而忽略了推理过程中的背景外观信息。因此，预测模型具有有限的目标-背景分辨能力。我们开发了一种端到端的跟踪体系结构，能够充分利用目标和背景外观信息进行目标模型预测。我们的体系结构是通过设...

原创 2021-11-14 20:11:47 · 2722 阅读 · 0 评论
Deep Learning for UAV-based Object Detection andTracking: A Survey（论文翻译)

目录摘要1.引言2.相关调查和简要统计A.无人机飞机统计数据B.挑战C.贡献3.无人机机载图像中的目标检测A.数据处理B.基于尺度多样性的目标检测C.小目标上的目标检测D.基于方向分集的目标检测E.基于检测速度的目标检测F.基于其他的目标检测4.无人机载视频中的目标检测A.基于光流的网络B.基于记忆网的网络C.基于跟踪的网络5.基于无人机视频的多目标跟踪A.Tracking-by-DetectionB.单目标跟踪辅助多目...

原创 2021-10-31 20:42:56 · 8452 阅读 · 0 评论
Aggregation Signature for Small Object Tracking（论文翻译）

目录摘要1.引言2.聚合签名A.聚合签名的定义B.前景聚合签名属性3.聚合签名跟踪器4.实验A.数据集B.图像上的聚合签名C.跟踪上的聚合签名5.结论论文地址：https://arxiv.org/pdf/1910.10859.pdf数据集：https://github.com/bczhangbczhang/摘要小目标跟踪成为一项越来越重要的任务，但在计算机视觉领域却鲜有人涉足。最大的挑战来自于这样一个事实：1)小物体的外观非常模...

原创 2021-10-28 10:18:39 · 742 阅读 · 4 评论
A Benchmark and Simulator for UAV Tracking（论文翻译）

目录摘要1.引言相关工作2.基准--离线评估2.1 数据集2.2 评估算法2.3 评估方法3.模拟器-在线评估3.1设置和限制3.2评估的新方法3.3评价方法论4.实验4.1 基准评估4.2模拟器评估(定量和定性结果)5.结论和下一步工作摘要本文提出了一种用于低空无人机目标跟踪的新的航空视频数据集和基准，以及一个可以与跟踪方法相结合的真实感无人机模拟器。我们的基准对从低空空中拍摄的123个新的、带完整注释的高清视频序...

原创 2021-10-26 22:32:21 · 1615 阅读 · 0 评论
LaSOT: A High-quality Benchmark for Large-scale Single Object Tracking（论文翻译）

目录摘要1.引言1.1 贡献2.相关工作2.1密集基准2.2 其他基准3.提出的LaSOT基准3.1 设计原则3.2 数据收集3.3 注释3.4 属性3.5评估方案4.评估4.1评估指标4.2 评估跟踪器4.3 按照方案I的评估结果4.4 按照方案II的评估结果4.5 在LaSOT的再训练实验5.结论摘要本文提出了一种高质量的大规模单目标跟踪基准算法LaSOT。LaSOT由1400个序列组成，...

原创 2021-10-26 19:27:26 · 2927 阅读 · 2 评论
TrackingNet: A Large-Scale Dataset andBenchmark for Object Tracking in the Wild(论文翻译)

目录摘要1.引言2.相关工作3.TrackingNet3.1从YT-BB到TrackingNet训练集3.2从YT-CC到TrackingNet测试集3.3 注释3.4 评价4.数据集实验5.跟踪基准5.1TrackingNet上最先进的基准测试5.2 实时跟踪5.3 在训练网络上再训练5.4特定于属性的结果6.结论摘要尽管在目标跟踪方面取得了许多进展，但当前跟踪算法的进一步发展受到小且几乎饱和的数据集的...

原创 2021-10-25 21:08:19 · 946 阅读 · 0 评论
Siamese Transformer Pyramid Networks for Real-Time UAV Tracking(论文翻译)

论文地址：https://arxiv.org/pdf/2110.08822.pdfCode：https://github.com/RISC-NYUAD/SiamTPNTracker目录摘要1.引言2.相关工作2.1 轻量级网络2.2 目标跟踪3.提出的方法3.1 特征提取网络3.2 特征融合网络3.3 Transformer金字塔网络3.4 预测头4.实验研究4.1 实施细节4.2 消融实验4.3与最先进的跟踪器的比较4.4真...

原创 2021-10-21 22:20:01 · 3764 阅读 · 0 评论
GOT-10k: A Large High-Diversity Benchmark forGeneric Object Tracking in the Wild（论文翻译）

论文地址：https://arxiv.org/abs/1810.11981Code：GOT-10k: Generic Object Tracking Benchmark目录摘要1.引言2.相关工作3.GOT-10K的构建4.实验5.结论摘要我们在这里介绍一个大型的跟踪数据库，它提供了对野外常见移动对象的空前广泛的覆盖，称为GOT-10K。具体地说，GOT-10k构建在WordNet结构[1]的主干上，它填充了超过560类移动对象和87种运动模式...

原创 2021-10-20 17:31:21 · 3448 阅读 · 0 评论
Siamese Keypoint Prediction Networkfor Visual Object Tracking(论文翻译)

论文：代码：GitHub - ZekuiQin/SiamKPN: Siamese Keypoint Prediction Network for Visual Object Tracking摘要视觉目标跟踪的目的是在给定初始边界框的情况下估计视频序列中任意目标的位置。通过利用离线特征学习，Siamese范例最近已成为高性能跟踪的领先框架。然而，现有的Siamese跟踪器要么严重依赖复杂的基于锚点的探测网络，要么缺乏抵抗干扰的能力。在本文中，我们提出了Siamese关键点预测网络(...

原创 2021-10-17 22:14:36 · 394 阅读 · 0 评论
SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks(论文翻译)

论文地址：https://arxiv.org/pdf/1812.11703.pdf项目地址：SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks摘要基于孪生网络的跟踪器将跟踪公式化为目标模板和搜索区域之间的卷积特征互相关。然而，与最先进的算法相比，孪生追踪器的准确度仍然有差距，而且它们不能利用深层网络的特性，例如 resnet-50或更深层次的特性。在本文中，我们证明了其核心原因在于缺乏严格...

原创 2021-10-15 15:31:13 · 884 阅读 · 0 评论

目标跟踪论文翻译

作者: MJ5513

Learning Dynamic Memory Networks for ObjectTracking(论文翻译)

XMem: Long-Term Video Object Segmentationwith an Atkinson-Shiffrin Memory Model（论文翻译）

STMTrack: Template-free Visual Tracking with Space-time Memory Networks（STMTrack: 基于时空记忆网络的无模板视觉跟踪）

Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows(论文翻译)

Masked Autoencoders Are Scalable Vision Learners（论文翻译）

Dual Attention Matching Network for Context-Aware Feature Sequence basedPerson Re-Identification（论文）

Dual Attention Network for Scene Segmentation(论文翻译)

Beyond Self-attention: External Attention usingTwo Linear Layers for Visual Tasks（论文翻译）

Learning Multi-Domain Convolutional Neural Networks for Visual Tracking(论文翻译)

Pyramid Correlation based Deep Hough Votingfor Visual Object Tracking（论文翻译）

Learning Spatio-Temporal Transformer for Visual Tracking（论文翻译）

Learning Discriminative Model Prediction for Tracking（论文翻译）

Deep Learning for UAV-based Object Detection andTracking: A Survey（论文翻译)

Aggregation Signature for Small Object Tracking（论文翻译）

A Benchmark and Simulator for UAV Tracking（论文翻译）

LaSOT: A High-quality Benchmark for Large-scale Single Object Tracking（论文翻译）

TrackingNet: A Large-Scale Dataset andBenchmark for Object Tracking in the Wild(论文翻译)

Siamese Transformer Pyramid Networks for Real-Time UAV Tracking(论文翻译)

GOT-10k: A Large High-Diversity Benchmark forGeneric Object Tracking in the Wild（论文翻译）

Siamese Keypoint Prediction Networkfor Visual Object Tracking(论文翻译)

SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks(论文翻译)