#今日论文推荐#TPAMI2022 | Dual ViT，京东（梅涛团队）提出双路径ViT结构，大大降低计算开销

最新推荐文章于 2024-07-10 20:03:11 发布

wwwsxn

最新推荐文章于 2024-07-10 20:03:11 发布

阅读量200

点赞数

分类专栏：神经网络 AI 文章标签：深度学习计算机视觉人工智能

原文链接：https://www.aminer.cn/research_report/630e09957cb68b460f0fa7e6

版权

AI 同时被 2 个专栏收录

27 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

#今日论文推荐#TPAMI2022 | Dual ViT，京东（梅涛团队）提出双路径ViT结构，大大降低计算开销

以前的工作已经提出了几种降低自注意力机制计算成本的策略。其中许多工作考虑将自注意力过程分解为区域和局部特征提取过程，每个过程产生的计算复杂度要小得多。然而，区域信息通常仅以由于下采样而丢失的不希望的信息为代价。在本文中，作者提出了一种旨在缓解成本问题的新型Transformer架构，称为双视觉Transformer（Dual ViT）。新架构结合了一个关键的语义路径，可以更有效地将token向量压缩为全局语义，并降低复杂性。这种压缩的全局语义通过另一个构建的像素路径，作为学习内部像素级细节的有用先验信息。然后将语义路径和像素路径整合在一起，并进行联合训练，通过这两条路径并行传播增强的自注意力信息。因此，双ViT能够在不影响精度的情况下降低计算复杂度。实证证明，双ViT比SOTA Transformer架构提供了更高的精度，同时降低了训练复杂度。

Transformer结构在革新深度学习应用方面取得了巨大成功，包括自然语言处理和计算机视觉任务。不幸的是，由于Transformer通常依赖密集的自注意力计算，因此对于高分辨率输入，此类架构的训练通常很慢。由于transformer技术通常可以提供比同类技术更高的性能，因此这种复杂性问题逐渐成为制约这种强大体系结构发展的瓶颈。

论文题目：Dual Vision Transformer
详细解读：https://www.aminer.cn/research_report/630e09957cb68b460f0fa7e6https://www.aminer.cn/research_report/630e09957cb68b460f0fa7e6
AMiner链接：https://www.aminer.cn/?f=cs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
#今日论文推荐#TPAMI2022 | Dual ViT，京东（梅涛团队）提出双路径ViT结构，大大降低计算开销

以前的工作已经提出了几种降低自注意力机制计算成本的策略。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。