本文只是记录个人阅读论文的感想与思考!难免存在错误!如若理解有误还请各位大佬指出!感谢!
目录
Abstract
本文提出的方法是将MRI图像分割成背景和三个分层区域
级联方法旨在根据子区域层次结构将脑肿瘤分割任务分解成三个二进制分割任务。主要分为三个步骤:
Step 1:分割整个肿瘤(WT)区域
Step 2:分割肿瘤核心区域(TC)
Step 3: 分割增强肿瘤核心区域(ET)
网络主要由以下几个核心部分组成:1)多层各向异性卷积滤波器 2)扩张卷积滤波器 3)多视图融合部分
Introduction
脑肿瘤分割所面临的挑战
1)肿瘤大小,形状定位在不同的患者之间存在的较大的差异
2)相邻结构之间的边界通常比较模糊不明确。
本文贡献
1)提出了一个级联的网络,将完整的脑肿瘤分割任务(多类分割问题)分解为3个2类分割问题,从而充分利用肿瘤的子区域,减少假阳性。(为什么可以减少假阳性?答:试想如果脑肿瘤分割任务只分割到完整的肿瘤区域,而不再对脑肿瘤的内部结构继续进行分割那么这样的分割结果也许还不错,也没那么容易出错。因为健康组织和肿瘤病变组织差别其实还挺大的,所以网络也不太容易产生错误的分割结果。但是如果还要继续细分肿瘤内的核心区域和水肿区域,核心区域和增强区域,这些区域的差别没有健康组合和肿瘤病变组织的差别那么大,所以网络很有可能产生错误,可能将水肿区域认为是核心区域等等!!)
2)提出了各向异性卷积和空洞卷积来减缓模型复杂度,感受野和内存消耗!
3)在三个正交视图中融合CNN的输出(旨在减少分割结果中的噪音)
方法(Method)
整体流程
三重级联架构如下图
1)使用第一个CNN网络WNet来分割整个肿瘤。
2)第二个网络TNet接受第一个网络分割出来的WT区域,在这个区域内继续分割肿瘤核心(TC)区域。
3)第三个网络ENet接受第二个网络分割出来的TC区域,在TC区域内继续分割增强肿瘤核心(ET)区域。
各向异性卷积神经网络
以往使用的3D卷积会造成巨大的计算开销,消耗大量的内存,它限制了分辨率和特征数量,使得模型的表示能力不足!但是较大的感受野又可以使网络获得全局信息!因此本文提出了各向异性卷积神经网络,在感受野和以上的多种限制中做了权衡!
具体来说,各向异性卷积将3*3*3的卷积分成一个3*3*1的卷积和一个1*1*3的卷积,相当于在Axial(轴向面)使用较大的感受野,与轴向面平行的两个面使用3*1的感受野,此外再加上残差块和空洞卷积!最后通过1*1*3的卷积恢复到正方体。
三个CNN网络结构
WNet,TNet,ENet的结构如下图
Wnet和Tnet有20个intra卷积层(3x3x1),和4个inter卷积层(1x1x3),两个池化层,Enet的卷积层跟Wnet一样但是池化层少一个。
多尺度预测融合
浅层学习表示局部和低级特征,深层学习表示更多全局信息和高级特征。
对不同尺度的特征图进行不同倍数(在WNet,TNet中的倍数分别是2,4,4)的上采样,最后将其进行堆叠形成输出结果
多视图融合
为了利用3D上下文信息,融合了3个不同的正交视图的分割结果。这三个面分别是axial;sagittal;coronal。其示意图如下
因为级联网络对于2D面以及垂直于这个2D面的平面的感受野是不相同的(垂直的感受野较小一些!) 因此要训练三个不同主面的级联网络,最后平均其SoftMax后的概率得到最终的结果!
缺点与不足
首先,下游网络的分割效果在很大程度上依赖于上游网络的性能。其次,只考虑上游分割结果作为输入,使得下游网络不能使用其他图像区域作为辅助信息,不利于肿瘤位置检测等其他任务。