前言
本文介绍了ParNet注意力机制及其在YOLOv11中的应用。ParNet注意力通过并行子网络结构,将网络层组织成多个子网络并行处理输入特征,降低了传统注意力机制在处理长序列时的计算复杂度。该机制采用VGG风格的块和特征融合策略,具有低深度高性能、参数效率高、可扩展性强和并行化能力好等创新点。我们将ParNet注意力引入YOLOv11,在检测头部分应用该机制。通过实验训练改进后的模型,有望提升YOLOv11在目标检测任务中的性能。
文章目录: YOLOv11改进大全:卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总
专栏链接: YOLOv11改进专栏
文章目录
介绍

摘要
深度是深度神经网络的核心特征,然而网络深度的增加往往伴随着顺序计算量的上升和延迟时间的增长。这引发了一个关键性问题:是否能够构建出具有高性能的"非深度"神经网络?本文证实了这一可能性。为实现此目标,我们采用了并行子网络架构而非传统的层级堆叠方式,从而在维持高性能的同时显著降低了网络深度。通过充分利用并行子结构,我们首次展示了深度仅为12的网络能够在ImageNet数据集上实现超过80%的Top-1准确率,在CIFAR10上达到96%的准确率,在CIFAR100上达到81%的准确率。此外,我们还证明了深度为12的骨干网络在MS-COCO数据集上能够实现48%的平均精度(AP)。我们对这一设计的扩展规律进行了深入分析,并阐明了如何在保持网络深度不变的前提下提升性能表现。最后,我们提供了一个概念验证,展示了非深度网络在构建低延迟识别系统方面的应用潜力。相关代码已发布于https://github.com/imankgoyal/NonDeepNetworks。
文章链接
论文地址:论文地址
代码地址:
订阅专栏 解锁全文
64

被折叠的 条评论
为什么被折叠?



