transformer在视觉检测的应用

最新推荐文章于 2024-05-31 16:45:01 发布

blanokvaffy

最新推荐文章于 2024-05-31 16:45:01 发布

阅读量2.2k

点赞数 1

分类专栏：深度学习视觉相关文章标签： pytorch transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/blanokvaffy/article/details/121588773

版权

深度学习视觉相关专栏收录该内容

12 篇文章 2 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

transformer在视觉检测的应用

detr简介
一些基于detr启发论文

近年，Transformers在计算机视觉领域大放异彩。将transformer带入目标检测/实例分割的工作如过江之鲫，不胜枚举。而2020年Detection Transformers（detr）更是带来一种新的目标检测范式，启发了后续众多的工作。

detr简介

Alt

detr结构

detr的结构如上图所示，图片经过cnn主干网络后得到特征图，加入位置信息后送入transfomer encoder，和一队可训练的object queries在transfomer decoder中进行交叉注意力计算，输出的结果经过FFN后直接得到回归框和类别分数，不需要nms等后处理，做到真正的端到端。
Alt

detr中使用的transformer结构

detr中使用的transformer结构如上图所示，可以看到其由encoder和decoder两大部分组成，其中encoder主要由self attention和ffn重复N次组成，decoder由self attention、cross attention、ffn重复M次组成（论文中N和M均为6），图中的“add&norm”分别代表残差结构和layernorm层。transformer解耦了cnn中的Spat

了解本专栏

超级会员免费看

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
transformer在视觉检测的应用

transformer在视觉检测的应用detr简介一些基于detr启发论文目标检测Deformable DETRConditional DETRSparse R-cnn实例分割/全景分割SOLQMaskformerK-Net近年，Transformers在计算机视觉领域大放异彩。将transformer带入目标检测/实例分割的工作如过江之鲫，不胜枚举。而2020年Detection Transformers（detr）更是带来一种新的目标检测范式，启发了后续众多的工作。detr简介 detr结构d
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。