YOLOv10改进 | 注意力篇 | YOLOv10引入Deformable Attention Transformer(DAT)注意力机制

最新推荐文章于 2024-07-11 14:13:15 发布

小李学AI

最新推荐文章于 2024-07-11 14:13:15 发布

阅读量177

点赞数 4

分类专栏： YOLOv10有效涨点专栏文章标签： YOLO transformer 深度学习目标检测计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tsg6698/article/details/139996239

版权

YOLOv10有效涨点专栏专栏收录该内容

74 篇文章 18 订阅 ¥59.90 ¥99.00

订阅专栏

1. Deformable Attention Transformer介绍

1.1 摘要：Transformers 最近在各种视觉任务中表现出了卓越的性能。较大的、有时甚至是全局的感受野赋予 Transformer 模型比 CNN 模型更高的表示能力。然而，简单地扩大感受野也会引起一些担忧。一方面，使用密集注意力（例如在 ViT 中）会导致过多的内存和计算成本，并且特征可能会受到超出感兴趣区域的不相关部分的影响。另一方面，PVT 或 Swin Transformer 中采用的稀疏注意力与数据无关，可能会限制对远程关系进行建模的能力。为了缓解这些问题，我们提出了一种新颖的可变形自注意力模块，其中自注意力中键和值对的位置以数据依赖的方式选择。这种灵活的方案使自注意力模块能够专注于相关区域并捕获更多信息特征。在此基础上，我们提出了可变形注意力变换器（Deformable Attention Transformer），这是一种通用骨干模型，具有可变形注意力，适用于图像分类和密集预测任务。大量实验表明，我们的模型在综合基准上取得了持续改进的结果。

官方论文地址：https://arxiv.org/pdf/2201.00520

官方代码地址：

了解本专栏

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
YOLOv10改进 | 注意力篇 | YOLOv10引入Deformable Attention Transformer(DAT)注意力机制

这种新的注意力模式不是简单地对所有查询分配固定的注意力点，而是学习一组与查询无关的偏移量，用于将所有者的键和值移动到重要区域。值得注意的是，虽然这种变形的多头注意力计算复杂性与PVT或Swin Transformer相当，但由于其独特的设计，使得内存复杂度保持在线性级别。到此本文的正式分享内容就结束了，在这里给大家推荐我的YOLOv10改进有效涨点专栏，后期我会根据各种最新的前沿顶会进行论文复现，也会对一些老的改进机制进行补充，如果大家觉得本文帮助到你了，订阅本专栏，关注后续更多的更新~
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。