AI 小团子-CSDN博客

原创 YOLO11涨点优化：注意力优化 | Triplet Attention 三重注意力机制接入，无需降维的跨维度交互，计算零负担

文章摘要： YOLO11的C2PSA注意力机制在空间维度建模上存在局限，缺乏跨维度交互能力。Triplet Attention通过创新的三分支结构解决了这一痛点，在不降维的情况下实现通道与空间维度的协同建模。其核心技术包括：1）Z-pool操作以极小计算代价编码特征分布；2）旋转操作建立跨维度依赖；3）残差连接保障稳定训练。实验证明，该模块在YOLO11上仅增加0.01M参数即可提升0.89% mAP50，特别适合小目标检测场景。本文从原理到实现完整解析了Triplet Attention的跨维度交互机制，

2026-04-16 10:35:57 141

原创 YOLO11涨点优化：注意力魔改 | 引入Criss-Cross Attention (CCNet)，通过十字交叉路径高效获取全图上下文信息

YOLO11作为Ultralytics 2024年最新发布的检测模型，通过C3k2模块和C2PSA注意力机制实现了高效检测，但仍存在全局上下文感知不足的问题。本文提出将Criss-Cross Attention(CCNet)集成到YOLO11中，通过稀疏十字交叉路径实现全图上下文建模，相比传统注意力机制可减少85%计算量。文章详细解析了CCNet的递归传播原理，提供了三种集成策略（Backbone替换/Neck增强/全链路优化），并给出PyTorch实现代码。该方法在保持YOLO11轻量级优势的同时，可提升

2026-04-16 10:34:21 129

原创 YOLO11涨点优化：注意力机制 | 结合ParNet网络中的全局注意力模块，极简架构下实现即插即用涨点

本文介绍了YOLO11目标检测模型与ParNetAttention注意力模块的创新结合。YOLO11通过C3k2模块和C2PSA注意力机制实现高效检测，而ParNetAttention通过并行分支结构捕获全局上下文信息，两者形成互补优势。文章详细解析了ParNetAttention的双分支设计（全局通道注意力+局部特征增强）及其轻量化特性，并提供了在YOLO11中集成该模块的实践指南。这种结合既保持了YOLO11原有的参数效率，又增强了模型对全局信息的捕捉能力，实测在多个数据集上实现1-2%的mAP提升，为

2026-04-15 11:39:55 293

原创 YOLO11涨点优化：注意力机制 | 引入Focal Modulation模块，替代传统自注意力，小目标检测涨点神器 | NeurIPS经典

本文探讨了YOLO11在小目标检测中的局限性，并提出使用Focal Modulation模块替代SPPF来提升性能。文章分析了SPPF模块的固定感受野设计导致小目标特征被稀释的问题，而Focal Modulation通过层级化上下文编码、门控聚合和仿射变换实现动态特征聚焦，在计算效率和小目标检测精度上均表现优异。实验证明，该方案在多个视觉任务中超越自注意力等主流方法，尤其适合高分辨率场景下的微小目标检测需求。

2026-04-15 11:08:44 145

原创 YOLO11涨点优化：注意力魔改 | LSKNet大核空间注意力机制接入，有效解决复杂背景下的小目标漏检问题

本文探讨了YOLO11在复杂场景下小目标检测的局限性，并提出结合LSKNet大核空间注意力机制的改进方案。LSKNet通过动态调整感受野的创新设计，解决了传统模型固定感受野的问题，在无人机航拍等场景中显著提升检测精度。文章从理论分析到实践部署，详细介绍了如何将LSKNet集成到YOLO11中，包括环境配置、核心代码实现及性能优化策略。实验数据显示，改进后的模型在VisDrone等数据集上mAP提升达14%以上，为小目标检测提供了有效的解决方案。

2026-04-14 08:34:20 252

原创 YOLO11涨点优化：注意力魔改 | 替换为FlashAttention-2，极限压缩内存读写，让YOLO11推理速度飙升的同时精度不减

本文介绍了如何将FlashAttention-2集成到YOLO11目标检测模型中，以解决自注意力机制的内存瓶颈问题。YOLO11作为Ultralytics最新发布的模型，通过C3k2模块和C2PSA注意力机制实现了高效性能，但仍面临传统自注意力计算的高内存消耗问题。文章详细解析了FlashAttention-2的三大核心技术：分块计算、在线Softmax和工作分区优化，这些技术显著减少了显存读写开销。实验数据显示，该方法在A100/H100 GPU上可提升训练吞吐量2倍，降低显存占用50%，推理速度提升0.

2026-04-14 08:31:23 225

原创 YOLO11涨点优化：注意力机制 | 融合DiNA (Dilated Neighborhood Attention)，完美捕捉多尺度局部与全局特征，CVPR2023

本文提出将CVPR2023提出的膨胀邻域注意力机制(DiNA)融合到YOLO11目标检测框架中。DiNA通过引入膨胀因子实现感受野指数级扩展，在不增加计算成本的前提下提升模型对全局上下文的捕捉能力。实验表明，融合DiNA后的YOLO11在COCO数据集上mAP提升2.3%，小目标检测性能显著增强。文章详细阐述了DiNA的原理、YOLO11架构的融合策略、代码实现方案以及部署优化方法，为注意力机制在目标检测中的应用提供了新的技术思路。

2026-04-13 12:41:19 231

原创 YOLO11涨点优化：注意力魔改 | 引入Vision Mamba (Vim) 核心状态空间模块，打破Transformer计算瓶颈，实现高效全局感知

摘要：YOLO11虽以C3k2模块和C2PSA注意力机制实现高效检测，但仍受传统注意力机制二次复杂度限制。本文提出将Vision Mamba（Vim）状态空间模型融入YOLO11架构，通过线性复杂度实现全局感知。重点剖析了三种实战方案：1）Mamba-YOLO（AAAI 2025方案）在COCO上提升7.5% mAP；2）轻量级MLLA模块实现即插即用改进；3）C2f_VSS结构将Vim核心模块"卷积化"嵌入。这些方案均保持YOLO实时性优势，特别适合高分辨率场景，为下一代目标检测系统提

2026-04-13 12:19:41 215

2601_95807009的博客