Transformer for visual tracking目标跟踪论文总结 -- CVPR 2021 ORAL

最新推荐文章于 2024-05-31 16:45:01 发布

JianqiuChen

最新推荐文章于 2024-05-31 16:45:01 发布

阅读量1.6k

点赞数

分类专栏：目标跟踪文章标签：目标跟踪深度学习神经网络自动驾驶 pytorch

本文链接：https://blog.csdn.net/JianqiuChen/article/details/115347741

版权

目标跟踪专栏收录该内容

4 篇文章 1 订阅

订阅专栏

Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking

这一篇是中国科学技术大学周文罡老师团队的作品，2021 CVPR ORAL

1. Motivation

In video object tracking, there exist rich temporal contexts among successive frames, which have been largely overlooked in existing trackers.
在视频目标跟踪中，连续帧间存在着丰富的时间上下文，但是现有的跟踪器大多忽略了这一点。

2. 主要贡献

使用Siamese-like 跟踪pipeline，将transformer的encoder 和 decoder 结构分割成两个并行的分支

3. 主体设计

主体框架：

在这里插入图片描述

创新点：

在这里插入图片描述

改变传统Transformer中的固有结构，受Siamese like 模型的影响，将encoder 和 decoder 分割成为平行的两个分支。
Block Weight-sharing encoder及decoder 中的自注意力块共享权重，将模板和搜索区域嵌入到一个特征空间以方便进行 cross-attention 计算。
Instance Normalization：通过实例层面的归一化，保留有价值的图像振幅信息。
Slimming Design 轻量化设计去掉了全连接层并保持了single-head attention。

具体细节可以查看论文原文：Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking
或者这篇文章： https://blog.csdn.net/qq_39621037/article/details/115189929

JianqiuChen

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
Transformer for visual tracking目标跟踪论文总结 -- CVPR 2021 ORAL

Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking这一篇是中国科学技术大学周文罡老师团队的作品，2021 CVPR ORAL1. MotivationIn video object tracking, there exist rich temporal contexts among successive frames, which have been largely overlooke
复制链接

扫一扫