CAF-YOLO：生物医学图像中的微小病变检测新方法

神秘泣男子

已于 2025-01-10 11:23:11 修改

阅读量1.1k

点赞数 16

分类专栏：编程探索文章标签：深度学习

于 2024-11-25 13:30:00 首次发布

本文链接：https://blog.csdn.net/jxjdhdnd/article/details/144018616

版权

编程探索专栏收录该内容

81 篇文章

订阅专栏

🏡作者主页：点击！

🤖编程探索专栏：点击！

⏰️创作时间：2024年11月25日10点53分

神秘男子影,
秘而不宣藏。
泣意深不见,
男子自持重,
子夜独自沉。

引言与背景

近年来，目标检测技术在生物医学影像领域取得了显著进展，尤其是在精确定位和识别病变方面，如癌细胞和肺结节。

尽管如此，现有方法在检测微小生物医学实体（如小于3毫米的异常细胞和肺结节）方面仍存在精度不足的问题。

CAFBlock的引入：

在YOLOv8架构中引入了一个新的组件，称为CAFBlock，它由ACFM和MSNN组成，每个CAFBlock都策略性地放置在YOLOv8主干网络之后，以增强全局和局部特征的建模。

3.2 Attention and Convolution Fusion Module (ACFM)

设计动机：

考虑到卷积操作的局部感受野限制，有效地捕获全局特征可能面临挑战。相反，Transformers擅长提取全局特征和处理长距离依赖关系，这得益于它们的注意力机制。通过融合卷积和注意力机制，可以巧妙地建模全局和局部特征。

ACFM的结构：

ACFM包括全局分支和局部分支。全局分支引入了自注意力机制以增强长距离信息交互，而局部分支通过通道洗牌增强模型复杂性，从而增强表示能力和减少过拟合的风险。
在全局分支中，通过1×1卷积和3×3深度卷积操作生成查询（Q）、键（K）和值（V）张量。然后，通过softmax归一化计算注意力图，从而减少计算负担。
在局部分支中，首先使用1×1卷积调整通道维度，然后通过通道洗牌操作和深度可分离卷积来增强特征的交互和整合。

3.3 Multi-Scale Neural Network (MSNN)

设计动机：

认识到Vision Transformer架构中FFN的单尺度特征聚合的局限性，作者引入了MSNN来增强非线性变换。

MSNN的结构：

MSNN通过两个并行路径处理输入特征。在较低路径中，使用3×3深度卷积进行特征提取，并引入ReLU激活函数引入非线性特性。
在上路径中，为了增强感受野并提取更广泛的特征，使用两个具有不同扩张率的3×3扩张卷积层。然后，通过元素-wise乘积操作引入门控机制，增强非线性变换。
最后，使用1×1卷积核调整最终输出的维度。

实验与分析

数据集

BCCD 数据集：

BCCD（Blood Cell Count and Detection）数据集是一个全面的、轻量级的图像集合，包含12,500张真实的高分辨率显微镜下的血液样本图像。

数据集提供了多种类型的血细胞图像，包括正常和异常的血细胞，捕获了各种形状、大小和染色特征。

图像代表了四种主要类型的血细胞：红细胞（RBCs）、白细胞（WBCs）、血小板，以及这些细胞的组合，覆盖了不同的视野和细胞密度。

LUNA16 数据集：

LUNA16 是目前肺部结节检测中最具代表性和权威性的高质量肺结节CT图像数据集。

数据集包含888个3D肺部CT图像，1186个肺结节，以及36378个由4名专业放射科医生注释的信息。数据集由四部分组成：原始CT图像、肺结节位置注释文件、原始CT肺部区域分割文件和诊断结果文件。

论文中按照7:2:1的比例划分训练集、测试集和验证集。

对比实验

在BCCD数据集上的比较：

将CAF-YOLO与BCCD数据集上的最先进目标检测方法进行比较，结果表明CAF-YOLO在所有评估指标上都优于列出的纯目标检测方法。
例如，CAF-YOLO在mAP@50、mAP@50-95和精确度上分别比ADA-YOLO高出1%、1.1%和2.7%，在召回率上比YOLOv5高出0.6%。

在LUNA16数据集上的比较：

为了评估CAF-YOLO在医学图像目标检测中的泛化能力，将其与LUNA16数据集上的最先进基于CNN的目标检测方法进行比较，结果表明CAF-YOLO在mAP@50和精确度上分别比YOLOv9高出1.7%和2.9%。

消融实验

作者在BCCD数据集上进行了消融实验，比较了不同配置下的性能，包括mAP@50、mAP@50-95、召回率和精确度等指标。

实验结果

下表展示了在BCCD数据集上逐步引入新提出的组件对模型性能的影响。以下是各个配置的详细分析：

分析

ACFM的有效性：通过比较ID:1（基线模型）和ID:2（加入ACFM的模型），发现mAP@50得分从0.888提高到0.913，表明ACFM能显著提升模型性能，有效捕获全局和局部特征。
MSNN的影响：通过比较ID:1和ID:3，发现mAP@50得分从0.888提高到0.899，表明MSNN通过提取多尺度特征改善了特征聚合，从而提高了模型性能。
全局分支和局部分支的影响：通过比较ID:1、ID:3与ID:4、ID:5，发现加入全局分支和局部分支后，mAP@50得分分别提高到0.901和0.902，表明全局分支能捕获更丰富的全局特征，而局部分支通过通道洗牌增强了模型的表示能力和泛化能力。