【目标跟踪】|Exemplar Transformers

最新推荐文章于 2024-05-31 16:45:01 发布

rrr2

最新推荐文章于 2024-05-31 16:45:01 发布

阅读量526

点赞数

分类专栏：目标跟踪文章标签：目标跟踪深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35608277/article/details/125702722

版权

目标跟踪专栏收录该内容

21 篇文章 15 订阅

订阅专栏

transformer 中 self-attention 计算如公式：

在这里插入图片描述
Q,K 的序列长度均为图像尺寸，公式 2 计算复杂度为图像尺寸的平方，这样带来较大计算负担。作者认为，对所有特征之间的关联在机器翻译中是必要的，但是在视觉任务中是不必要的。因为机器翻译中每个特征都代表一个特定的单词或标记，而视觉任务中相邻的空间通常表示相同的物体。因此在视觉任务中，可以减少特征向量的数量，构建一个更粗略更具描述性的视觉表达，从而显著降低计算复杂度。

作者首先提出了两个假设：

一个小的 exemplar value 集合可以在一个数据集之间共享；
一个粗略的查询具有足够的描述性来利用这些 exemplar value。

在这里插入图片描述

上述提出的 Exemplar Transformer layer 可以作为卷积的替代，作者将 LightTrack 的预测头分支所有卷积换成了 Exemplar Transformer，构建新的跟踪器 E.T.Track 如图 4 所示。

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【目标跟踪】|Exemplar Transformers

transformer 中 self-attention 计算如公式：Q,K 的序列长度均为图像尺寸，公式 2 计算复杂度为图像尺寸的平方，这样带来较大计算负担。作者认为，对所有特征之间的关联在机器翻译中是必要的，但是在视觉任务中是不必要的。因为机器翻译中每个特征都代表一个特定的单词或标记，而视觉任务中相邻的空间通常表示相同的物体。因此在视觉任务中，可以减少特征向量的数量，构建一个更粗略更具描述性的视觉表达，从而显著降低计算复杂度。作者首先提出了两个假设：一个小的 exemplar value 集合可以在
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。