CVPR 2021 Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking

最新推荐文章于 2024-05-26 09:30:21 发布

smile909

最新推荐文章于 2024-05-26 09:30:21 发布

阅读量1.3k

点赞数 2

分类专栏： CVPR 2021

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/smile909/article/details/115289923

版权

动机

视觉目标跟踪是计算机视觉中的一项基本任务。尽管最近取得了一些进展，但由于遮挡、变形、外观变化等因素的影响，它仍然是一项具有挑战性的任务。
在视频目标跟踪任务中，现有的跟踪器中被忽略了连续帧之间存在着丰富的时间上下文信息。

方法

在这里插入图片描述

为了在独立的视频帧之间建立桥梁，并传递丰富的时间线索。提出了一种新的transformer辅助跟踪框架。由于提出的transformer接收图像特征嵌入，共同将这些图像特征嵌入归一化到实例（图片块）级，以保留有价值的图像幅度信息。将transformer编码器和解码器在这样一个通用的类孪生结构内分成两个分支。在顶部分支中，一组模板图片块被馈送到transformer编码器，该编码器通过基于注意力的特征增强来来相互加强多个模板特征，以生成高质量的编码特征。在底部分支中，搜索特征以及先前的模板内容被馈送到transformer解码器，其中搜索图片块从历史模板中检索和聚集信息化的目标线索（例如，空间掩模和目标特征），传递到对应的帧中，以增强自身，方便了目标的搜索过程。编码器和解码器中的自注意力块共享权重，该权重将模板和搜索嵌入在相同的特征空间中，以方便做进一步的交叉注意力计算，从而传播时间上下文（例如，特征和注意力）。对于视觉跟踪场景，效率是至关重要的。为了实现速度和性能的良好平衡，通过省略完全连接的前馈层和主要使用轻量级的单头注意力来简化经典transformer。

Tra

最低0.47元/天解锁文章

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
CVPR 2021 Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking

动机视觉目标跟踪是计算机视觉中的一项基本任务。尽管最近取得了一些进展，但由于遮挡、变形、外观变化等因素的影响，它仍然是一项具有挑战性的任务。在视频目标跟踪任务中，现有的跟踪器中被忽略了连续帧之间存在着丰富的时间上下文信息。方法为了在独立的视频帧之间建立桥梁，并传递丰富的时间线索。提出了一种新的transformer辅助跟踪框架。由于提出的transformer接收图像特征嵌入，共同将这些图像特征嵌入归一化到实例（图片块）级，以保留有价值的图像幅度信息。将transformer编码器和解码器在这
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。