YOLOv8改进专栏
文章平均质量分 97
本专栏将持续复现各类顶会方法与最新模块,聚焦于YOLOv8模型的精度改进与性能优化。所有内容均以论文视角展开,结合详尽步骤与实测代码,打造手把手教学式教程,助力深入理解与高效魔改YOLO模型。专为科研入门、模型优化、论文复现等需求设计,欢迎订阅,一起进阶目标检测前沿!
余额抵扣
助学金抵扣
还需支付
¥99.90
¥299.90
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
魔改工程师
专栏涵盖 YOLO 系列、RT-DETR 模型、多模态融合等前沿目标检测改进方向,内容持续更新。每篇文章均附完整源码+详细步骤,实测可复现,真正实现从入门到顶会的科研成长路径。订阅专栏即可解锁模型优化思路、写作技巧、选刊建议、答疑支持等实用内容,助你快速突破瓶颈,高效产出科研成果,发文不再焦虑
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
YOLOv8改进 - 注意力机制 | Mamba之MLLAttention :曼巴线性注意力通过状态空间模型与线性注意力融合实现长序列高效建模
本文介绍了类Mamba线性注意力机制(MLLA),这是一种结合了Mamba模型与线性注意力Transformer优势的高效视觉注意力机制。该方法通过将Mamba中的关键设计(如遗忘门和块设计)融入线性注意力,利用线性归一化替代Softmax函数,在保持模型并行计算速度的同时显著降低了计算复杂度。我们将 MLLA 模块集成进 YOLOv8 的 Neck 部分,增强了模型对长序列和高分辨率输入的特征提取能力。实验结果表明,引入 MLLA 的 YOLOv8 模型在保持快速推理速度的同时,显著提升了在密集预测任务中原创 2026-01-21 22:35:54 · 531 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | Triplet Attention (三重注意力) 通过跨维度交互捕捉增强多尺度目标特征表征
本文介绍了三重注意力机制(Triplet Attention),这是一种通过三分支结构捕获跨维度交互以计算注意力权重的轻量化方法。该方法利用旋转操作构建通道与空间维度间的依赖关系,有效编码通道间和空间信息,且计算开销极低。我们将 Triplet Attention 模块集成进 YOLOv8 的 Neck 部分,插入于特征融合后的 C2f 模块之后,增强了模型对关键特征的提取能力。实验结果表明,引入 Triplet Attention 的 YOLOv8 模型在目标检测任务中能够以可忽略的额外计算成本显著提升检原创 2026-01-21 22:39:26 · 412 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | BRA (Bi-Level Routing Attention) 双层路由注意力通过动态稀疏计算优化长距离依赖建模
本文介绍了双层路由注意力机制(Bi-Level Routing Attention, BRA),这是一种旨在解决多头自注意力机制(MHSA)可扩展性问题的动态稀疏注意力机制。该方法通过双层路由策略,首先在粗粒度区域级别过滤掉无关的键值对,仅保留少量路由区域,随后在细粒度像素级别进行注意力计算,从而实现查询感知的高效计算。我们将 BRA 集成进 YOLOv8 的 Neck 部分,替代原有的部分卷积层,使模型在保持高检测精度的同时显著降低了计算和内存开销。实验结果表明,引入 BRA 的 YOLOv8 模型在多个原创 2026-01-21 22:22:05 · 526 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | CPCA (Channel Prior Convolutional Attention) 通道先验卷积注意力通过动态权重分配增强复杂场景特征感知
本文介绍了通道先验卷积注意力(CPCA)及其在YOLOv8中的结合应用。医学图像分割面临挑战,现有注意力机制效果不佳,CPCA应运而生。它结合通道注意力和空间注意力,通过多尺度深度可分离卷积模块提取空间关系并保留通道先验。通道注意力学习通道重要性,空间注意力捕捉位置关系。我们将CPCA代码引入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8-CPCA.yaml`文件,最后经实验脚本和结果验证了改进的有效性。原创 2026-01-21 22:10:01 · 1016 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | CoTAttention (Contextual Transformer Attention) 上下文转换器注意力通过静态与动态上下文协同建模增强视觉表征
本文介绍了上下文Transformer(CoT)块及其在YOLOv8中的结合应用。大多数现有设计未充分利用邻近键的上下文信息,为此提出CoT块。它先通过3×3卷积对输入键进行上下文编码得到静态表示,再与输入查询连接,经两个1×1卷积学习动态多头注意力矩阵,与输入值相乘得到动态表示,最后融合二者作为输出。我们将CoTAttention代码引入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8-CoTAttention.yaml`文件,最后经实验脚本和结果验证了改进的有效性原创 2026-01-21 22:14:23 · 597 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | CoordAttention (Coordinate Attention) 坐标注意力通过位置信息嵌入增强移动端特征表征能力
本文介绍了坐标注意力(Coordinate Attention)及其在YOLOv8中的结合应用。现有通道注意力常忽略位置信息,坐标注意力将位置信息嵌入通道注意力,通过坐标信息嵌入和坐标注意力生成两个步骤增强特征表达。它把通道注意力分解为两个1D特征编码过程,能捕获长距离依赖并保留位置信息,生成的注意力图可增强目标表示。我们将CoordAtt代码引入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8-CoordAttention.yaml`文件,最后经实验脚本进行训练验证原创 2026-01-21 22:17:35 · 633 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | SKAttention:选择性核注意力通过多分支融合与自适应感受野调整优化多尺度目标检测
本文介绍了SKAttention(选择性核注意力)机制,这是一种受生物视觉皮层启发的动态多尺度特征提取方法。该技术通过Split、Fuse和Select三个算子,使神经元能根据输入自适应调整感受野大小,通过不同卷积核分支的软注意力融合来捕捉复杂的空间特征。我们将SKAttention集成进YOLOv11(基于YOLOv8架构演进),在保持计算效率的同时显著增强了模型对多尺度目标的检测能力。实验表明,该改进能有效提升模型在复杂场景下的特征聚合与理解能力。原创 2026-01-21 22:46:14 · 630 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | SGE (Spatial Group-wise Enhance) 空间分组增强模块通过语义组注意力因子优化复杂背景特征提取
本文介绍了空间分组增强模块(Spatial Group-wise Enhance, SGE),这是一种旨在改善卷积神经网络中语义特征学习的轻量化注意力机制。该方法通过将特征图分组,利用全局与局部特征描述符的相似性生成注意力因子,从而在不引入大量参数的情况下自主增强各组的特征表达并抑制噪声干扰。我们将 SGE 模块集成进 YOLOv8 的 Neck 部分及 C2f 构造块中,有效提升了模型对高阶语义特征的捕捉能力。实验结果表明,引入 SGE 的 YOLOv8 模型在保持轻量化优势的同时,显著增强了特征的空间鲁原创 2026-01-21 22:28:49 · 551 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | Agent Attention (代理注意力) 通过双阶段Softmax注意力以线性复杂度实现全局上下文建模
本文介绍了代理注意力(Agent Attention)及其在YOLOv8中的结合应用。传统全局注意力机制计算成本高,为此提出Agent Attention,创新性地引入代理向量A,形成四元组(Q, A, K, V)。它由两个Softmax注意力操作组成,等效于广义线性注意力,兼具高性能与高效性。为发挥其潜力,还定义了Agent Bias并采用DWC模块。我们将Agent Attention代码引入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8_AgentAttent原创 2026-01-15 22:44:36 · 645 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | CAA (Context Anchor Attention) 上下文锚点注意力增强复杂场景多尺度目标特征感知
本文介绍了上下文锚点注意力(CAA)模块及其在YOLOv8中的结合应用。遥感图像目标检测面临目标尺度变化和上下文多样的挑战,PKINet引入CAA模块来应对。CAA模块先通过全局平均池化和1×1卷积提取局部特征,再用条带卷积捕捉远程上下文信息,最后用Sigmoid生成注意力权重图增强特征。该模块具有轻量化、特征增强和多尺度适应的优点。我们将CAA代码引入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8_CAA.yaml`文件,最后经实验脚本和结果验证了改进的有效性。原创 2026-01-15 22:41:34 · 807 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | MSCA (Multi-Scale Convolutional Attention) 即插即用增强复杂场景小目标检测鲁棒性
本文介绍了多尺度卷积注意力(MSCA)及其在YOLOv8中的结合应用。基于变换器的模型在语义分割领域占主导,但卷积注意力在编码上下文信息方面更高效。MSCA由深度卷积聚合局部信息、多分支深度卷积捕获多尺度上下文信息、1×1逐点卷积模拟通道关系三部分组成。我们将MSCA代码引入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8_MSCA.yaml`文件,最后通过实验脚本和结果验证了改进的有效性。原创 2026-01-15 22:38:16 · 605 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | MCA (Multidimensional Collaborative Attention) 多维协作注意力通过三分支结构增强通道与空间特征协同建模
本文介绍了多维协作注意力(MCA)及其在YOLOv8中的结合应用。现有注意力机制方法存在忽略维度建模或计算负担重的问题,为此提出MCA,其通过三分支架构同时推断通道、高度和宽度维度注意力,几乎无额外开销。MCA关键在于挤压和激励变换,前者聚合特征,后者捕获局部交互。我们将MCA代码引入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8_MCA.yaml`文件,最后经实验脚本和结果证明改进有效。原创 2026-01-15 22:34:35 · 505 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | MSDA (Multi-Scale Dilated Attention) 多尺度空洞注意力通过动态感受野增强多尺度目标检测
本文介绍了多尺度扩张注意力(MSDA)及其在YOLOv8中的结合应用。标准视觉变换器存在计算成本高或关注接受域小的问题,为此提出MSDA,其利用多尺度扩张机制,能捕获局部稀疏的补丁交互,降低自注意机制的冗余。MSDA通过多头设计,不同头部设置不同扩张率,在不同尺度上捕获语义信息并聚合。我们将MSDA代码引入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8_MSDA.yaml`文件,最后通过实验脚本和结果验证了改进的有效性。原创 2026-01-15 22:31:52 · 556 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | HaloNet 局部自注意力网络通过分块与扩展感受野实现高效空间交互建模
自注意力机制因其与参数无关的感受野扩展能力以及基于内容的交互方式,被认为有潜力提升计算机视觉系统的性能,这与卷积的参数依赖型感受野扩展和与内容无关的交互方式形成了鲜明对比。最近的研究表明,与基线卷积模型(如 ResNet-50)相比,自注意力模型在精度-参数权衡方面取得了令人鼓舞的改进。在这项工作中,我们旨在开发不仅能超越经典基线模型,还能超越高性能卷积模型的自注意力模型。我们提出了两种自注意力的扩展方法,并结合一种更高效的自注意力实现方式,提升了这些模型的速度、内存使用效率和准确性。原创 2026-01-15 22:28:10 · 586 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | Axial Attention (轴向注意力) 通过分轴计算优化高维张量处理,实现高效全局依赖建模
本文介绍了基于轴向注意力(Axial Attention)的Axial Transformers在YOLOv8中的结合。现有自回归模型处理高维数据时存在计算资源需求大等问题,而Axial Attention通过对张量单个轴进行注意力计算,降低了计算复杂度和内存需求,且通过堆叠层可实现全局感受野。我们将相关代码加入指定目录,在`ultralytics/nn/tasks.py`中注册,配置`yolov8 - AxialImageTransformer.yaml`文件,最后通过实验脚本和结果验证了方法的有效性。原创 2026-01-15 22:20:45 · 570 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | SCSA (Spatial and Channel Synergistic Attention) 空间通道协同注意力通过多语义空间先验与通道自注意力协同增强特征表
本文介绍了空间与通道协同注意力模块(SCSA),旨在揭示空间和通道注意力在多语义层面的协同关系。SCSA由可共享多语义空间注意力(SMSA)和渐进式通道自注意力(PCSA)组成,SMSA通过划分特征图和深度可分离卷积提取多语义空间信息,PCSA则进一步整合通道信息。两者相互协作,缓解多语义信息差异。我们将SCSA引入YOLOv8,在指定目录添加代码文件,在`ultralytics/nn/tasks.py`中注册,给出配置文件和实验脚本,实验展示了相关结果。原创 2026-01-05 22:42:39 · 936 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | SOCA (Second-Order Channel Attention) 二阶通道注意力通过协方差建模增强特征判别性
本文介绍了二阶通道注意力(SOCA)模块,它通过引入二阶统计信息来增强特征表示和学习特征间的相关性。传统通道注意力机制依赖一阶统计信息,忽略了通道间相互关系,而SOCA模块计算特征图通道的协方差,捕捉通道间依赖。其实现步骤包括特征提取、计算均值和协方差、生成注意力权重和特征重标定。我们将SOCA模块引入YOLOv8,在指定目录添加代码文件,在`ultralytics/nn/tasks.py`中注册,给出配置文件和实验脚本,实验展示了相关结果。原创 2026-01-04 22:36:24 · 1070 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | CGAFusion (Content-Guided Attention Fusion) 内容引导注意力融合解决多尺度特征自适应融合难题
本文介绍了内容引导注意力(CGA)机制,它结合通道注意力和空间注意力,为每个通道生成特定的空间重要性图,以更好地关注输入特征中的有用信息。CGA的通道注意力通过全局池化生成通道权重,空间注意力处理空间维度生成空间权重,二者结合生成最终注意力图。其优势在于通道特异性、空间关注和处理非均匀性。我们将基于CGA的CGAFusion模块引入YOLOv8,在指定目录添加代码文件,在`ultralytics/nn/tasks.py`中注册,并给出配置文件和实验脚本,实验给出了相关结果。原创 2026-01-04 22:33:44 · 931 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | GCT (Gaussian Context Transformer) 高斯上下文变换器通过预设高斯关系实现高效通道注意力
本文介绍了高斯上下文变换器(Gaussian Context Transformer,GCT),这是一种新型通道注意力模块,旨在提升深度卷积神经网络(CNN)的表现力。传统通道注意力模块通过全连接层或线性变换学习全局上下文与注意力激活的关系,但效果不佳。GCT假设该关系预先确定,由全局上下文聚合、归一化和高斯上下文激励三个操作组成。根据高斯函数标准差是否可学习,分为无参数的GCT - B0和有参数的GCT - B1。我们将GCT引入YOLOv8,在指定目录添加代码文件,在`ultralytics/nn/ta原创 2026-01-04 22:31:51 · 693 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | ELA (Efficient Local Attention) 高效局部注意力通过轻量化设计实现精准空间定位
本文提出高效局部注意力(ELA)机制,并将其集成到YOLOv8中。传统注意力机制在利用空间信息时存在不足,ELA旨在解决这些问题。其通过“条带池化”提取空间信息,用1D卷积处理特征向量,使用分组归一化替代批量归一化,最后生成空间注意力图。我们精心设计了三个超参数,形成四个不同版本以满足不同视觉任务需求。将ELA代码集成到YOLOv8后,在数据集上的实验表明,改进后的YOLOv8在目标检测任务中均优于当前方法。原创 2025-12-24 21:39:36 · 1112 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | ParNet (Parallel Subnetworks) 并行子网络结构以低深度实现高性能特征提取
本文提出ParNet注意力机制,并将其集成到YOLOv8中。传统深度神经网络计算复杂度高、延迟大,而ParNet通过并行子网络设计解决了这些问题。其核心是将网络层并行组织成多个子网络,采用VGG风格块进行特征提取,后期融合各子网络特征。该机制将序列分割成子序列独立计算注意力,降低了长序列计算复杂度。我们将ParNetAttention代码集成到YOLOv8中。实验表明,改进后的YOLOv8在多个数据集上表现良好,验证了非深度网络在保持高性能的同时可减少延迟。原创 2025-12-24 21:36:04 · 1046 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | CAFM (Convolution and Attention Fusion Module) 通过并行卷积与注意力分支实现高效特征融合
本文提出HCANet模型,并将其核心的CAFMAttention模块集成到YOLOv8中用于目标检测。传统方法在高光谱图像去噪时,对全局和局部特征的同时建模研究较少。HCANet采用U型网络结构,包含CAFM和MSFN模块。CAFM模块的局部分支用卷积和通道重排提取局部特征,全局分支用注意力机制捕获长距离依赖;MSFN模块通过并行扩张卷积实现多尺度信息聚合。我们将CAFMAttention代码集成到YOLOv8中。实验表明,改进后的YOLOv8在及目标检测任务中表现良好,验证了模型有效性。原创 2025-12-24 21:30:58 · 700 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | ACmix (Mixed Self-Attention and Convolution) 自注意力与卷积混合模型实现全局-局部特征协同建模
本文提出ACmix模型,并将其集成到YOLOv8中用于目标检测。传统卷积和自注意力通常被视为独立方法,ACmix发现二者存在内在联系,其核心是将自注意力和卷积技术结合。输入特征经三个1×1卷积投影后,自注意力路径按多头自注意力处理,卷积路径用轻量级全连接层和深度卷积处理,二者输出由可学习标量控制相加。我们将ACmix代码集成到YOLOv8中。实验表明,改进后的YOLOv8在图像识别和下游任务中表现优于竞争性基线,证明了该模型的有效性。原创 2025-12-24 21:24:45 · 1080 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | SEAM (Spatially Enhanced Attention Module) 空间增强注意力模块提升遮挡目标特征学习能力
本文提出基于单阶段检测器YOLOv5的实时人脸检测器YOLO - FaceV2,并将SEAM模块集成到YOLOv8中。传统人脸检测算法在精度、速度及处理遮挡等问题上存在不足。SEAM模块采用多头注意力机制,通过深度可分离卷积、1x1卷积、全连接网络学习面部特征,同时采用指数归一化提高模型鲁棒性。我们将SEAM代码集成到YOLOv8中。实验表明,改进后的YOLOv8在数据集上性能超过YOLO及其变体,在简单、中等和困难子集中均有提升,尤其在面部遮挡场景下表现出色。原创 2025-12-24 21:18:14 · 688 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | Triplet Attention 三重注意力通过跨维度交互捕捉增强特征表征
本文提出三重注意力(Triplet Attention)机制,并将其集成到YOLOv8中用于计算机视觉任务。传统注意力机制在计算通道和空间注意力时相互独立,未考虑两者关系。Triplet Attention由三个并行分支构成,通过旋转操作构建跨维度交互,利用Z-pool操作降低维度,经分支计算和空间注意力分支计算后,将结果聚合。我们将其代码集成到YOLOv8中。实验表明,改进后的YOLOv8在图像分类、目标检测等任务中提高了性能。原创 2025-12-24 21:13:18 · 871 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | D-LKA (Deformable Large Kernel Attention) 可变形大核注意力通过自适应感受野增强复杂目标检测
本文介绍了可变形大核注意力(D-LKA Attention)机制,该机制解决了Transformer在医学图像分割中计算成本高、忽略片间信息的问题。它通过大卷积核获取大感受野且控制计算开销,结合可变形卷积动态调整采样网格以适配数据模式,还设计了2D和3D版本(3D版擅长跨深度数据理解)。我们将D-LKA Attention集成进YOLOv11,构建分层视觉Transformer架构D-LKA Net。实验证明,该模型在数据集上表现优于现有方法,提升了分割精度。原创 2025-12-17 23:17:02 · 959 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | DAT (Deformable Attention) 可变形注意力通过动态采样点实现高效特征聚焦
本文介绍了可变形自注意力模块DAttention,该模块解决了传统Transformer注意力机制计算成本高、对无关信息敏感等问题。它通过数据依赖的位置选择、灵活的偏移学习等机制,动态聚焦关键区域,捕捉有效特征。我们将DAttention集成进YOLOv8,替代原有模块提升特征提取能力。实验证明,集成该模块的YOLOv8在检测任务中表现更优,验证了可变形注意力的有效性。原创 2025-12-17 23:13:42 · 1197 阅读 · 0 评论 -
YOLOv8 改进 - 注意力机制 | EMA(Efficient Multi-Scale Attention)高效多尺度注意力通过跨空间学习增强特征表征
本文提出了新颖高效的多尺度注意力(EMA)模块,并将其与YOLOv8结合以提升性能。该模块着重保留各通道信息、降低计算开销,通过将部分通道重塑为批量维度、分组通道维度,使空间语义特征分布更均匀。其创新点包括高效多尺度注意力机制、通道维度重塑、并行子网络设计等,在目标检测任务中表现出色。EMA模块结合通道和空间信息,采用多尺度并行子网络结构,优化坐标注意力机制。实验表明,将EMA集成进YOLOv8后,模型在图像分类和目标检测任务上有更好表现。原创 2025-12-17 23:05:26 · 1572 阅读 · 0 评论 -
YOLOv8 改进 - 注意力机制 | HAT (Hybrid Attention Transformer) 混合注意力变换器,通过激活更多像素提升小目标重建能力
本文介绍了混合注意力Transformer(HAT),针对图像超分辨率任务设计,结合通道注意力与窗口自注意力,引入重叠交叉注意力模块增强窗口间信息交互,还采用同任务预训练策略挖掘模型潜力。该模型通过浅层/深层特征提取、图像重建模块完成超分辨率任务,深层提取依托RHAG结构整合残差连接与混合注意力。将HAT集成进YOLOv11,替换相关特征处理模块,实验表明YOLOv11-HAT在检测任务中表现良好,提升了模型特征提取与交互能力。原创 2025-12-17 22:58:31 · 900 阅读 · 0 评论 -
YOLOv8 改进 - 注意力机制 | iRMB (Inverted Residual Mobile Block) 倒置残差移动块实现局部与全局特征高效协同
本文介绍了倒置残差移动块(iRMB),并将其集成到YOLOv8中。传统轻量级模型在资源受限设备上存在性能瓶颈,iRMB融合了CNN和Transformer架构的优点,既保留了CNN建模短距离依赖的高效性,又具备Transformer动态建模长距离交互的能力。其创新点包括融合架构优势、设计简单高效、优化资源消耗、实现技术突破以及具备灵活性和泛化能力。我们将iRMB集成到YOLOv8,经注册和配置yaml文件后进行实验,结果表明该方法在目标检测任务中具有良好效果。原创 2025-12-17 22:50:51 · 796 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | LSKA (Large Separable Kernel Attention) 大核分离卷积注意力实现高效长程依赖建模
本文介绍了Large Separable Kernel Attention (LSKA) 模块,并将其集成进YOLOv8。视觉注意网络(VAN)中的大卷积核注意力(LKA)模块存在计算和内存占用问题,LSKA通过将2D深度卷积核分解为水平和垂直的1D卷积核,解决了这些问题。该模块降低了计算复杂度和内存占用,使VAN更关注物体形状。我们将LSKA代码集成到YOLOv8中,在tasks文件注册,并配置yolov8-LSKAttention.yaml。实验表明,LSKA模块在对象识别、检测、分割和稳健性测试上表现原创 2025-12-09 22:14:16 · 829 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | LSKNet (Large Selective Kernel Network) 大核选择网络实现动态感受野优化
本文介绍了大型选择性核网络(LSKNet),并将其核心注意力机制集成进YOLOv8。遥感目标检测常忽略场景先验知识,LSKNet通过LSKblock Attention动态调整感受野,处理不同目标的广泛上下文。其结构包含LSK module、LSK Block等,通过大核卷积和空间核选择实现特征提取与选择。我们将LSKNet相关代码集成到YOLOv8中,在tasks文件注册,并配置yolov8-lsknet.yaml。实验表明 集成后的YOLOv8在目标检测任务中也有良好效果。原创 2025-12-09 22:07:43 · 779 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | MLCA (Mixed Local Channel Attention) 混合局部通道注意力实现局部与全局特征融合
本文介绍了轻量级的Mixed Local Channel Attention (MLCA) 模块,并将其集成进YOLOv8。实时目标检测需要提高网络表达效果,MLCA模块通过局部池化、分支处理和信息融合,同时考虑通道、空间、局部和全局信息。其工作原理包括提取局部空间信息、捕获通道交互信息以及融合全局和局部信息。我们将MLCA代码集成到YOLOv8中,在tasks文件中注册,并配置yolov8-MLCAttention.yaml文件。实验证明,在Pascal VOC和SMID数据集上,该方法相比其他注意力技术原创 2025-12-09 22:03:48 · 1038 阅读 · 0 评论 -
YOLOv8改进 - 注意力机制 | Non-Local 非局部注意力:突破局部感受野限制,实现高效上下文信息整合
本文介绍了非局部操作(Non-Local)与YOLOv8的结合。传统卷积和循环网络一次处理局部邻域,作者受非局部均值方法启发,提出非局部操作,计算某位置响应为所有位置特征加权和,可插入多种网络架构。该操作能直接捕捉远程依赖,可作为组件与其他网络结合,在多种视觉任务尤其是视频分类中效果良好。我们将NLBlockND模块引入YOLOv8,对代码进行修改和注册,并配置了yolov8 - non_local.yaml文件。实验脚本展示了其在目标检测任务中的应用。原创 2025-12-03 22:56:32 · 994 阅读 · 0 评论 -
YOLOv8 改进 - 注意力机制 | Polarized Self-Attention 极化自注意力实现精细化双重维度特征建模
本文介绍了极化自注意力(PSA)块与YOLOv8的结合。像素级回归在细粒度计算机视觉任务中具有挑战性,为解决长距离依赖建模问题,提出PSA块,融合极化过滤和增强两个关键设计,实现高质量像素级回归。PSA块通过对输入特征进行空间和通道维度处理,增强模型特征表征能力。我们将PolarizedSelfAttention模块引入YOLOv8,对代码进行修改和注册,并配置了yolo8 - PolarizedSelfAttention.yaml文件。实验脚本展示了其在目标检测任务中的应用。原创 2025-12-03 22:50:57 · 814 阅读 · 0 评论 -
YOLOv8 改进 - 注意力机制 | STA (Super Token Attention) 超级令牌注意力实现高效全局上下文建模
本文介绍了超级令牌注意力(STA)机制与YOLOv8的结合。视觉Transformer在浅层捕获局部特征时存在冗余问题,为解决早期阶段全局上下文建模的挑战,受超像素设计启发,引入超级令牌,提出STA机制,包括超级令牌抽取、自注意力处理和映射回原始令牌空间三个步骤,提高了捕获全局依赖的效率。基于STA,开发了层次化视觉Transformer。我们将StokenAttention模块引入YOLOv8,对代码进行修改和注册,并配置了yolov8 - stoken_attention.yaml文件。实验脚本显示了原创 2025-12-03 22:46:38 · 604 阅读 · 0 评论
分享