UNet++: A Nested U-Net Architecture for Medical Image Segmentation

最新推荐文章于 2024-07-29 12:51:53 发布

风轻云淡_Cauchy

最新推荐文章于 2024-07-29 12:51:53 发布

阅读量1.0k

点赞数

分类专栏：图像处理文章标签：计算机视觉深度学习 cnn

本文链接：https://blog.csdn.net/duanyuwangyuyan/article/details/122216167

版权

图像处理专栏收录该内容

18 篇文章 1 订阅

订阅专栏

UNet++: A Nested U-Net Architecture for Medical Image Segmentation

0、摘要论文特点
1、U-Net++网络结构
2、实验

0、摘要论文特点

网络特点
深度监督的编解码网络。通过一系列嵌套、密集的跳跃路径连接。
缘由
使用跳跃路径，为了降低语义差异：编解码子网络间的特征图。
评价对比
从以下四方面的分割任务，和U-Net以及宽泛U-Net结构【备注1】进行对比。
1 ) 胸部低剂量造影CT扫描的结节分割；
2）显微镜图像下的细胞核分割；
3）腹部CT下的肝脏分割；
4）结肠镜视频下的息肉分割。
实验结果
比U-Net和宽泛U-Net的IoU分别提升了3.9和3.4个百分点。

【备注1】：设计宽泛U-Net结构，是为了确保U-Net++网络结构所产生的性能增益并不仅仅是由于参数数量的增加

1、U-Net++网络结构

在这里插入图片描述
U-Net++网络结构由如下几部分组成：

1.1、主架构

由一系列嵌套、密集的卷积块儿链接的编解码组成。
作用：在融合之前，弥合编码器和解码器的特征图之间的语义差异。
架构中，黑色部分是原始的U-Net网络；绿色和蓝色部分是跳跃路径上的密集卷积块儿，红色部分是深度监督。（红、绿、蓝组件是U-Net++区别于U-Net的部分）

1.2、分支细节

在这里插入图片描述
挑其一支，进行细节解析，即对跳跃路径的设计分析：

$x^{i,j}$ 表示节点 $X^{i,j}$ 的输出，其中 $i$ 表示编码的下采样层； $j$ 表示跳跃路径下密集块儿的卷积层。
由 $x^{i,j}$ 计算公式如下：
在这里插入图片描述
其中，函数 $H (.)$ 是一个卷积、激活函数的操作； $U (.)$ 上采样层；[ ]是串联操作。详细解释：

j = 0时
卷积的对象是只有上一编码层 $x^{i-1,j}$
j = 1时
两个输入对象的串联体的卷积、激活操作；这两个串联体是
j > 1时
j+1个输入对象：j个前0,1,…j-1节点的相同跳跃路径的输出 + 来自更低跳跃路径的上采样输出。

1.3、深度监督（红色部分）

本文使用Deep Supervision【这篇文章也一并在博客中学习】，使得能够在两种模式下运行：

精确模式
所有分割分支的输出都被平均。
快速模式
最终的分割特征图，仅仅从分割分支之一中选择，根据模型修剪程度和加速增益进行选择。

该网络结构的损失函数由交叉熵和dice系数(医疗图像分割模型VNet中提出)结合，且适用于网络结构c部分中四个语义level的每一个。定义为：
在这里插入图片描述
其中， $\hat{Y_b}$ and $Y_b$ 分别是flatten预测概率和flatten ground truths，N 是batch 大小。