YOLOv11/10/8算法改进【NO.162】引入用于医学图像分割的高效多尺度卷积注意力

人工智能算法研究院

已于 2025-04-15 21:27:43 修改

阅读量551

点赞数 9

分类专栏： YOLO算法改进系列文章标签： YOLO 算法

于 2025-04-15 21:10:56 首次发布

本文链接：https://blog.csdn.net/m0_70388905/article/details/147258559

版权

YOLO算法改进系列专栏收录该内容

156 篇文章

订阅专栏

前言
YOLO算法改进系列出到这，很多朋友问改进如何选择是最佳的，下面我就根据个人多年的写作发文章以及指导发文章的经验来看，按照优先顺序进行排序讲解YOLO算法改进方法的顺序选择。具体有需求的同学可以私信我沟通：

首推，是将两种最新推出算法的模块进行融合形成最为一种新型自己提出的模块然后引入到YOLO算法中，可以起个新的名字，这种改进是最好发高水平期刊论文。后续改进将主要教大家这种方法，有需要的朋友可私信我了解。

第一，创新主干特征提取网络，将整个Backbone改进为其他的网络，比如这篇文章中的整个方法，直接将Backbone替换掉，理由是这种改进如果有效果，那么改进点就很值得写，不算是堆积木那种，也可以说是一种新的算法，所以做实验的话建议朋友们优先尝试这种改法。

第二，创新特征融合网络，这个同理第一，比如将原yolo算法PANet结构改进为Bifpn等。

第三，改进主干特征提取网络，就是类似加个注意力机制等。根据个人实验情况来说，这种改进有时候很难有较大的检测效果的提升，乱加反而降低了特征提取能力导致mAP下降，需要有技巧的添加。

第四，改进特征融合网络，理由、方法等同上。

第五，改进检测头，更换检测头这种也算个大的改进点。

第六，改进损失函数，nms、框等，要是有提升检测效果的话，算是一个小的改进点，也可以凑字数。

第七，对图像输入做改进，改进数据增强方法等。

第八，剪枝以及蒸馏等，这种用于特定的任务，比如轻量化检测等，但是这种会带来精度的下降。

...........未完待续

一、创新改进思路或解决的问题

通过利用独特的多尺度深度会议lution 块，通过多尺度卷积。EMCAD 还采用通道、空间和分组（大核）门控注意力机械-Anisms，在捕获复杂的空间关系，同时关注突出区域。由采用分组和深度卷积。

二、基本原理

摘要：高效且有效的解码机制至关重要在医学图像分割中，尤其是在有限的计算资源。但是，这些解码机制通常伴随着高昂的计算成本。为了解决这一问题，我们推出了 EMCAD，这是一种新的效率Cient 多尺度卷积注意力解码器，设计以优化性能和计算效率。EMCAD 利用独特的多尺度深度会议lution 块，通过多尺度卷积。EMCAD 还采用通道、空间和分组（大核）门控注意力机械-
Anisms，在捕获复杂的空间关系，同时关注突出区域。由采用分组和深度卷积，EMCAD 是非常高效且扩展性好（例如，只有 1.91M 参数-ter 和 0.381G FLOPs 在使用 stan-dard 编码器）。我们对属于 6 个医学图像分割任务的 12 个数据集进行了严格评估，结果表明 EMCAD 实现了最先进的（SOTA）性能，#Params 和 #FLOPs 分别减少了 79.4% 和 80.3%。此外，EMCAD 对不同编码器的适应性和跨分割任务的多功能性进一步确立了 EMCAD 作为一种有前途的工具，推动该领域朝着更高效、更准确的医学图像分析方向发展。

三、添加方法

部分代码如下所示，具体可关注后私信我获取。yolov11n为baseline。

backbone:
  # [from, repeats, module, args]
  - [-1, 1, Conv, [64, 3, 2]] # 0-P1/2
  - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4
  - [-1, 2, C3k2, [256, False, 0.25]]
  - [-1, 1, Conv, [256, 3, 2]] # 3-P3/8
  - [-1, 2, C3k2, [512, False, 0.25]]
  - [-1, 1, Conv, [512, 3, 2]] # 5-P4/16
  - [-1, 2, C3k2, [512, True]]
  - [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32
  - [-1, 2, C3k2, [1024, True]]
  - [-1, 1, SPPF, [1024, 5]] # 9
  - [-1, 2, C2PSA, [1024]] # 10

# YOLO11n head
head:
  - [-1, 1, EUCB, []]
  - [[-1, 6], 1, Concat, [1]] # cat backbone P4
  - [-1, 2, C3k2, [512, False]] # 13

  - [-1, 1, EUCB, []]
  - [[-1, 4], 1, Concat, [1]] # cat backbone P3
  - [-1, 2, C3k2, [256, False]] # 16 (P3/8-small)

  - [-1, 1, Conv, [256, 3, 2]]
  - [[-1, 13], 1, Concat, [1]] # cat head P4
  - [-1, 2, C3k2, [512, False]] # 19 (P4/16-medium)

  - [-1, 1, Conv, [512, 3, 2]]
  - [[-1, 10], 1, Concat, [1]] # cat head P5
  - [-1, 2, C3k2, [1024, True]] # 22 (P5/32-large)

  - [[16, 19, 22], 1, Detect, [nc]] # Detect(P3, P4, P5)

四、总结

预告一下：下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我，有问题可以留言或者私聊我哦

PS：该方法不仅仅是适用改进YOLOv8，也可以改进其他的YOLO网络以及目标检测网络，比如YOLOv7、v6、v4、v3，Faster rcnn ，ssd等。