ET-Net: A Generic Edge-aTtention Guidance Network for Medical Image Segmentation
ET-Net:一种用于医学图像分割的通用边缘保持引导网络
cv 2019
背景
分割是医学图像分析中的一项基本任务。然而,现有的大多数方法都专注于主区域提取,而忽略了边缘信息,这有助于获得准确的分割。在本文中,我们提出了一种通用的医学分割方法,称为边缘注意力引导网络(ET-Net),该方法嵌入边缘注意力表示来引导分割网络。具体而言,边缘引导模块用于学习早期编码层中的边缘注意力表示,然后将其转移到多尺度解码层,使用加权聚合模块进行融合。在四个分割任务(即视网膜图像中的视盘/杯和血管分割,以及胸部X射线和CT图像中的肺部分割)上的实验结果表明,保留边缘注意力表示有助于提高最终的分割精度,并且我们提出的方法优于目前最先进的分割方法
贡献
将边缘检测和对象分割集成在一个深度学习网络中。为此,我们提出了一种新的通用医学分割方法,称为边缘注意力引导网络(ET-Net),该方法嵌入边缘注意力表示来指导分割过程。在我们的ET-Net中,提供了一个**边缘引导模块(EGM)来学习边缘注意力表示并在早期编码层中保持局部边缘特征,而设计了一个加权聚合模块(WAM)**来聚合来自解码层的多尺度侧输出,并将边缘注意力表示转移到高级层以改进最终结果。
实验
数据集::视网膜图像、X射线和CT图像。为了方便比较,我们选择了与通用分割高度相关的评估指标。视网膜图像中的视盘和视杯分割:我们评估了我们在视网膜图像中视盘和视杯分割的方法,这是青光眼检测中的一项常见任务。本实验使用了两个公共数据集:REFUGE3数据集,由400张训练图像和400张验证图像组成;Drishti GS[14]数据集,其中包含50个训练图像和51个验证图像。考虑到眼底图像中非目标区域的负面影响,我们首先按照现有的自动椎间盘检测方法[5]定位椎间盘中心,然后将定位的图像传输到我们的网络中。
方法
主要基于编码器-解码器网络,末尾附加了EGM和WAM模块。ResNet-50[8]被用作编码器网络,它包括四个编码块(E块),每个编码块用于不同的特征图分辨率。对于每个E块,输入首先经过特征提取流,该流由1×1−3×3−1×1卷积层组成,然后与输入的快捷方式相加以生成最终输出。通过这种剩余连接,模型可以生成特定于类的高级特征。解码器路径由三个级联的解码块(D块)组成,用于保持来自E块的高级特征的特性并增强其表示能力。如图6所示,如图2(a)所示,D块首先采用深度卷积来增强融合的低级和高级特征的表示。然后,使用1×1卷积来统一通道的数量。
Edge Guidance Module(边缘引导模块)
边缘信息提供了有用的细粒度约束,以指导分割过程中的特征提取。然而,只有低级特征才能保留足够的边缘信息。因此,我们只在解码路径的早期层(即e块1和2)的顶部应用EGM,如图所示。1。EGM有两种主要方式:1)它提供了边缘注意力表示以指导解码路径中的分割过程;2) 它使用边缘检测损失来监督早期卷积层。The Lov ́asz-Softmax loss [2] is used in our EGM
Weighted Aggregation Module(加权聚合模块)
为了适应对象的形状和大小变化,现有的方法倾向于总结沿通道维度的多尺度输出,以进行最终预测(例如,[5,19])。但是,并不是高级层中的所有功能都被激活并有利于对象的恢复。为了解决这一问题,我们开发了WAM来强调有价值的特征,并聚合多尺度信息和边缘注意力表示来提高分割性能。如图1所示,每个D块的输出被馈送到加权块中,以突出显示有价值的信息。加权块的结构如图2(b)所示。在该块中,首先使用全局平均池来聚合输入的全局上下文信息,然后应用具有不同非线性激活函数的两个1×1卷积层,即ReLU和Sigmoid,来估计层相关性并生成沿信道维度的权重。之后,将生成的权重与输出相乘,以产生更具代表性的特征。
损失函数
The Lovasz-Softmax loss [2] is used in our EGM边界损失
分割损失也是 Lovasz-Softmax,α=0.3
Thinking
边界引导模块,加权聚合模块。边界和分割互利的思想,共同促进