即插即用篇 | YOLOv8引入局部自注意力 HaloAttention | 为参数高效的视觉主干网络扩展局部自注意力

迪菲赫尔曼

于 2024-05-11 21:18:55 发布

阅读量643

点赞数 1

分类专栏： YOLOv8改进实战文章标签： YOLO 网络人工智能注意力机制即插即用深度学习 Pytorch

原创文章为博主个人所有，未经授权不得转载、摘编、传播、倒卖、洗稿或利用其它方式使用上述作品。违反上述声明者，本站将追求其相关法律责任。

本文链接：https://blog.csdn.net/weixin_43694096/article/details/138729980

版权

YOLOv8改进实战专栏收录该内容

该专栏为热销专栏榜第3名

114 篇文章 906 订阅 ¥299.90 ¥99.00

订阅专栏

本改进已集成到 YOLOv8-Magic 框架。

在这里插入图片描述

我们提出了Axial Transformers，这是一个基于自注意力的自回归模型，用于图像和其他组织为高维张量的数据。现有的自回归模型要么因高维数据的计算资源需求过大而受到限制，要么为了减少资源需求而在分布表达性或实现的便捷性上做出妥协。相比之下，我们的架构既保持了对数据联合分布的完全表达性，也易于使用标准的深度学习框架实现，同时在需要合理的内存和计算资源的同时，达到了标准生成建模基准测试的最先进结果。我们的模型基于axial attention，这是自注意力的一个简单泛化，自然地与张量的多个维度在编码和解码设置中对齐。值得注意的是，所提出的层结构允许在解码过程中并行计算大部分上下文，而不引入任何独立性假设。这种半并行结构极大地促进了甚至是非常大的Axial Transformer的解码应用。我们在ImageNet-32 和 ImageNet-64 图像基准测试以及BAIR Robotic Pushing视频基准测试上展示了Axial Transformer 的最先进结果。我们开源了Axial Transformers 的实现。

1 论文简介

自注意力因为参数独立的感受野缩放和内容依赖的交互作用，有望改善计算机视觉系统，这与参数依赖的缩放和内容独立的卷积交互形成对比。自注意力模型最近在精度与参数之间的权衡上显示出与基线卷积模型（如

了解本专栏

迪菲赫尔曼

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
3
评论
即插即用篇 | YOLOv8引入局部自注意力 HaloAttention | 为参数高效的视觉主干网络扩展局部自注意力

局部自注意力 HaloAttention
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

迪菲赫尔曼 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。