YOLOv11改进 | 注意力篇 | YOLOv11引入Deformable Attention Transformer(DAT)注意力机制

小李学AI

于 2024-10-07 20:43:41 发布

阅读量14

点赞数 1

分类专栏： YOLOv11有效涨点专栏文章标签： YOLO transformer 深度学习计算机视觉人工智能目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tsg6698/article/details/142745235

版权

YOLOv11有效涨点专栏专栏收录该内容

该专栏为热销专栏榜第5名

60 篇文章 13 订阅 ¥69.90 ¥99.00

订阅专栏

1. Deformable Attention Transformer介绍

1.1 摘要：Transformers 最近在各种视觉任务中表现出了卓越的性能。较大的、有时甚至是全局的感受野赋予 Transformer 模型比 CNN 模型更高的表示能力。然而，简单地扩大感受野也会引起一些担忧。一方面，使用密集注意力（例如在 ViT 中）会导致过多的内存和计算成本，并且特征可能会受到超出感兴趣区域的不相关部分的影响。另一方面，PVT 或 Swin Transformer 中采用的稀疏注意力与数据无关，可能会限制对远程关系进行建模的能力。为了缓解这些问题，我们提出了一种新颖的可变形自注意力模块，其中自注意力中键和值对的位置以数据依赖的方式选择。这种灵活的方案使自注意力模块能够专注于相关区域并捕获更多信息特征。在此基础上，我们提出了可变形注意力变换器（Deformable Attention Transformer），这是一种通用骨干模型，具有可变形注意力，适用于图像分类和密集预测任务。大量实验表明，我们的模型在综合基准上取得了持续改进的结果。

官方论文地址：

了解本专栏

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。