(2021.06, iccv) Swin Transformer Hierarchical Vision Transformer using Shifted Windows

最新推荐文章于 2024-09-30 23:54:43 发布

chaoqinyou

最新推荐文章于 2024-09-30 23:54:43 发布

阅读量172

点赞数

分类专栏：感知文章标签： transformer 深度学习人工智能计算机视觉 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chaoqinyou/article/details/129132819

版权

感知专栏收录该内容

19 篇文章 1 订阅

订阅专栏

Swin-Transformer是一种创新的Transformer模型，它通过在局部窗口内进行注意力操作实现了线性复杂度，并通过移位窗口增强模型表达力。该模型在分类、分割和2D目标检测等任务上表现出色，且速度较快。引入的局部性和相对位置偏置显著提高了性能，同时，通过消融实验验证了设计的有效性。

摘要由CSDN通过智能技术生成

code: https://github.com/microsoft/Swin-Transformer

一、创新点

引入局部性，在local window里面做attention，把计算量和图片的尺寸限制到线性；merge patch，在深层获得全局性

shift window, 连接不同的local window，提高模型的表达能力；

在分类，分割，2D框检测等任务上都是SOAT，而且很快

二、精度和速度

相近计算量下，在分类，2D目标检测和语义分割任务上都有明显长点，貌似2D目标检测长点最明显；

另一个感觉是，swin因为引入了局部性，ImageNet也能训练出来；

三、实现

W-MSA: 限制在窗口内的多头注意力机制

SW-MSA：移动窗口后的限制在窗口内的多头注意力机制

relative position bias 如下，通过消融实验可以看到涨点明显。

话说右图的那篇文章和写这篇Swin Transformer的基本上是一批人，所以传承很重要啊。

四、消融实验

五、重要参考文献

Training data-efficient image transformers & distillation through attention

Local Relation Networks for Image Recognition

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

chaoqinyou CSDN认证博客专家 CSDN认证企业博客

码龄13年

42: 原创

14万+: 周排名

15万+: 总排名

4万+: 访问

: 等级

449: 积分

32: 粉丝

23: 获赞

13: 评论

145: 收藏

私信

关注

热门文章

分类专栏

最新评论

(2022 IV) RCBEV
sangba2019: 博主，你好。我看你分享的论文多是radar-camera feature级的融合，请问博主对前融合有研究么
stable diffusion webui 搭建和初步使用
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618243930。
论文阅读笔记：(2021.10 CoRL) DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries
K Ronaldo: 博主您好，关于这个论文我看了非常久，有一个问题一直弄不明白。就是他们的速度预测是怎么实现的呢？他们似乎完全没有用到时序信息
(2022.05) BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird‘s-Eye View Representation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
(2019.01, iclr) Decoupled Weight Decay Regularization
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

轻松应对HR面试 1133

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。