ERDUnet: An Efficient Residual Double-codingUnet for Medical Image Segmentation

ERDUnet:一种用于医学图像分割的高效残差双编码单元

摘要

医学图像分割在临床诊断中有着广泛的应用,基于卷积神经网络的分割方法已经能够达到较高的准确率。然而,提取全局上下文特征仍然很困难,而且参数太大,无法临床应用。为此,我们提出了一种新的网络结构来改进传统的编码器-解码器网络模型,在保持分割精度的同时节省了参数。通过构造一个能够同时提取局部特征和全局连续性信息的编码器模块,提高了特征提取效率。设计了一种新的注意力模块,在优化分割边界区域的同时提高训练效率。改进了解码部分的特征传递结构,充分融合了不同层次的特征,更精细地还原了空间分辨率。我们在7个不同的医学分割数据集上评估了我们的模型,这些数据集分别是2018年数据科学碗挑战赛(DSBC2018)、2018年病变边界分割挑战赛(ISIC2018)、结肠组织学图像中的腺体分割挑战赛(GlaS)、KvasirSEG、CVC-ClinicDB、Kvasir-Instrument和polygen。大量的实验结果表明,我们的模型在保持较少的参数和计算量的情况下,可以获得良好的分割性能,进一步促进理论方法在临床实践中的推广。

我们的代码将在https://github.com/caijilia/ERDUnet上发布。

1 介绍

医学图像分析是现代临床疾病诊断的一项基础性工作。分割结果可以从医学图像提供的大量病理信息中识别出疾病诊断所需的病变区域,便于医生进一步对病变进行评估。准确的分割可以帮助医生获得可靠的形态学统计数据,用于疾病诊断。例如,在染色组织切片图像中检查不同组织学分级腺体的形态,判断腺体组织是否癌变[1]。及时诊断可以帮助医生及早干预治疗,避免病情恶化,降低死亡率。例如,皮肤癌可以通过皮肤镜来识别

早期及时诊断可使95%的患者平均生存率提高5年[3]。

目前,大多数医院依靠经验丰富的医疗专业人员用肉眼进行视觉识别。这是一项耗时费力的任务。与此同时,人工分割带来的另一个问题是缺乏统一的标准和指南,往往只依靠临床经验,不同的人在处理同一目标时可能产生不同的分割结果[4]。医疗资源分布不均将加剧这一现象的后果。由于缺乏高水平的医生进行诊断,即使患者可以使用显像机获得足够的病理图像,也可能错过最佳的治疗时机。

计算机辅助诊断(CAD)系统是解决这一问题的重要途径,它利用计算机视觉技术协助医疗专业人员进行高质量的临床诊断。医学图像分割技术是计算机辅助设计的重要组成部分。它负责从医学图像中自动分割病变区域,用于后续的诊断和分析。在实际的医学场景中,用于诊断的病理图像的模态是不均匀的。病灶区域的形状往往不规则,分割目标与背景的对比度差异往往不是很明显[5]。此外,更具体的一点是,病变区域的大小可以根据个体患者的差异而有很大差异。

医学图像中这些目标特征给分割算法的设计带来了很大的挑战。

为了克服这些挑战,基于深度学习的医学图像分割方法正发挥着越来越重要的作用[6]-[9]。然而,这些方法通常具有大量的参数和较高的计算负荷[10]-[13],使得理论模型难以推广到临床实践。因此,我们的研究动机是在保持分割精度的同时降低模型复杂度,从而设计出一种适合临床实践的高精度、高效的分割网络模型。

因此,我们提出了一种新的分割网络结构。首先,我们在编码部分提出了一种新的上下文增强编码器(Context Enhanced Encoder, CEE)模块,该模块包括两个分支,分别负责提取局部空间细节特征和全局上下文连续性特征。在解码部分,我们提出了一种新的特征重用融合解码器(FFD)模块,该模块使用多个跳过连接构建密集连接的模式。这种方法融合了编码部分的浅层特征,提高了编码效率

网络使用效率和解码精度。为了消除编码和解码子网之间的语义差距,我们设计了一个接收域聚合(MRA)模块作为转换链路。最后,我们利用这些模块设计了两个相互独立的小参数编解码器网络。为了实现分割性能的进一步突破,我们构建了一种新的两层网络范式,允许两个独立的网络协同使用,以提高最终的分割性能。根据平衡模型性能和计算负荷的设计原则,我们最终实现了一个学习效率高、节约资源的双网络模型。我们提出的分割模型可以准确分割困难的病变区域,其准确率与经验丰富的医生手工分割的准确率相当,甚至在一些不明显的样本上也能取得更好的效果。同时,深度学习方法可以更好地提取不同患者之间个体独立的疾病一致性特征。因此,它可以为诊断结果的形成提供可靠的数据支持,帮助医生做出更准确的诊断,设计更有针对性的治疗方案。同时,基于该模型可以形成一个自动化的分割流程,减少医生的工作量。本文的主要贡献如下:1)设计了一种差分区域注意机制,该机制侧重于根据不同阶段特征中的不同区域提取高级语义,从而优化分割结果中的边界区域,提高模型学习效率。

2)从特征提取和融合的角度对经典u型结构进行综合改进,提高了编码效率和解码信息量,从而在降低模型参数尺度的同时提高了分割性能。

3)本文提出了一种新的双网络模型,以获得更精细的分割结果。在七个公开的医疗数据集上进行的大量实验显示了非常好的性能,验证了模型的有效性和鲁棒性。

2 相关工作

A.基于卷积神经网络的医学图像分割

基于卷积神经网络的方法广泛应用于医学图像分割领域,其中Unet[6]是最经典的方法,被广泛用作各种分割任务的主干。基于该编码器-解码器框架,开发了一系列改进模型,其中提出了各种改进。Unet++[10]提出在原有结构上增加一系列嵌套的跳过连接,克服编码部分和解码部分之间的语义差距,提高性能。

Unet3+[11]延续了这一思路,提出了全尺寸密集连接,以充分挖掘特征图的细节

不同尺度,提高了对不同尺度器官的分割效果。ResUnet++[14]利用残差块解决了网络深度加深时容易出现的退化问题,在数据集较少的情况下可以很好地应用。MSRF-Net[4]综合利用多尺度融合和残差块,对编码部分输出的浅层特征设计了信息交换模块,以捕获不同目标的可变性。Double-Unet[12]从整体层面考虑,提出将两个Unet结构叠加组合,以更有效地提取更有效的信息。

然而,所有这些基于卷积的模型都存在感知场有限的问题。我们通过在特征编码中引入特征嵌入方法来解决这一问题,以实现卷积操作感知领域的进一步扩展。

B.基于Transformer的医学图像分割

基于变压器的模型由于具有较好的全局特征提取能力而得到了广泛的应用。其中,TransUnet[15]将变压器模块作为卷积层编码输出的补充,丰富了编码结果的全局上下文信息。Transfuse[16]将传统的u型结构扩展为两支路并行结构,通过将基于卷积的路径和基于变压器的路径并行融合,提高分割性能,为原变压器方法提供空间诱导偏置信息。为了降低模型的复杂性,Colonformer[17]引入了轻量级Mix变压器[18]模块,最终在计算负荷和精度上取得了很好的折衷。swwin -transformer是对Visiontransformer的改进。SwinUnet[19]利用该模块实现了一个完全基于变压器的分割网络,实现了从局部到全局的自关注编码,能够更好地适应目标尺度的变化。SSFormer[5]提出以原有的Swin Transformer为主干构建分层架构,通过图像patch的合并和位移窗口的使用实现参数约简,通过集成Multilayer Perceptron (MLP)作为解码器完成分割任务,最终实现整体模型的轻量化。

尽管基于transformer的方法已经显示出良好的结果,但是它需要大量带注释的数据来保持训练的有效性,这是非常劳动密集型的,并且很难实现。因此,我们的模型仍然是基于卷积运算实现的,但其中设计了一种补偿机制,可以增强全局上下文信息的特征学习。本设计提高了性能,打破了对数据的要求,使其更适合医学图像分割任务。

C.注意机制

注意机制是深度神经网络中一种常用的优化技术,它可以提高特征提取的效率。CBAM[20]提出了通道注意[21]与空间注意相结合的方法,得到了广泛的应用

用于各种视觉任务。SLSM-CA[22]提出为背景区域设计两个注意分支&

  • 19
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值