YOLOv11融合[CVPR2024]EMCAD中的上采样模块

最新推荐文章于 2025-01-04 23:09:00 发布

今天炼丹了吗

最新推荐文章于 2025-01-04 23:09:00 发布

阅读量1.2k

点赞数 15

分类专栏： YOLOv11与自研模型专栏文章标签： YOLO

本文链接：https://blog.csdn.net/StopAndGoyyy/article/details/144408493

版权

YOLOv11与自研模型专栏专栏收录该内容

61 篇文章

订阅专栏

YOLOv11v10v8使用教程： YOLOv11入门到入土使用教程

YOLOv11改进汇总贴：YOLOv11及自研模型更新汇总

《EMCAD: Efficient Multi-scale Convolutional Attention Decoding for Medical Image Segmentation》

一、模块介绍

论文链接：https://arxiv.org/pdf/2405.06880

代码链接：https://github.com/SLDGroup/EMCAD/tree/main

论文速览：

高效且有效的解码机制在医学图像分割中至关重要，尤其是在计算资源有限的场景中。但是，这些解码机制通常伴随着高昂的计算成本。为了解决这个问题，我们推出了 EMCAD，这是一种新的高效多尺度卷积注意力解码器，旨在优化性能和计算效率。EMCAD 利用独特的多尺度深度卷积块，通过多尺度卷积显著增强特征图。EMCAD 还采用了通道、空间和分组（大核）门控注意力机制，这些机制在捕获复杂的空间关系时非常有效，同时专注于突出区域。通过采用分组和深度卷积，EMCAD 非常高效且扩展性好（例如，使用标准编码器时只需要 1.91M 参数和 0.381G FLOP）。我们对属于 6 个医学图像分割任务的 12 个数据集进行了严格评估，结果表明，EMCAD 实现了最先进的（SOTA）性能，#Params 和 #FLOPs 分别减少了 79.4% 和 80.3%。此外，EMCAD 对不同编码器的适应性和跨分割任务的多功能性进一步确立了 EMCAD 作为一种有前途的工具，推动该领域朝着更高效、更准确的医学影像分析方向发展。

总结：作者提出一种医学图像分割模型，模型中包含特征提取模块和高效的上采样模块，本文更新上采样模块。

⭐⭐本文二创模块仅更新于付费群中，往期免费教程可看下方链接⭐⭐

YOLOv11及自研模型更新汇总（含免费教程）文章浏览阅读366次，点赞3次，收藏4次。群文件2024/11/08日更新。,群文件2024/11/08日更新。_yolo11部署自己的数据集https://xy2668825911.blog.csdn.net/article/details/143633356

⭐⭐付费项目简介：融合上百种顶刊顶会模块的YOLO项目仅119（赠百种改进的v9），此外含自研模型与本文模块融合进行二创三创，最快1-2周完成小论文改进实验，代码每周更新（上周更新超20+二创模块），欢迎QQ：2668825911(或点击下方小卡片扫二维码)加我了解。⭐⭐

⭐⭐本项目并非简单的模块插入，平均每个文章对应4-6个二创或自研融合模块，有效果即可写论文或三创。本文项目使用ultralytics框架，兼容YOLOv3\5\6\8\9\10\world与RT-DETR。⭐⭐

已进群小伙伴可以先用下文二创及自研模块在自己的数据集上测试，有效果再进行模块结构分析或继续改进。

二、二创融合模块

2.1 相关二创模块及所需参数

本节无二创模块

2.2更改yaml文件 (以自研模型为例)

yam文件解读：YOLO系列 “.yaml“文件解读_yolo yaml文件-CSDN博客

打开更改ultralytics/cfg/models/11路径下的YOLOv11.yaml文件，替换原有模块。

2.3 修改train.py文件

创建Train脚本用于训练。

from ultralytics.models import YOLO
import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE'

if __name__ == '__main__':
    model = YOLO(model='ultralytics/cfg/models/xy_YOLO/xy_yolov1-ConvNeXt.yaml')
    # model = YOLO(model='ultralytics/cfg/models/11/yolo11l.yaml')
    model.train(data='./datasets/data.yaml', epochs=1, batch=1, device='0', imgsz=320, workers=1, cache=False,
                amp=True, mosaic=False, project='run/train', name='exp',)