U-Net 是一种经典的神经网络架构,广泛用于医学图像分割任务。它的名称来源于其形状与字母 “U” 相似的网络结构。U-Net 的设计旨在解决图像分割任务中样本稀疏性和边缘细节保留的问题。
神经网络大致描述:左半部分的过程称为Encoder(编码器部分),编码器由一系列卷积层和池化层组成。每个卷积层通常由一次卷积操作、激活函数(如ReLU)和批归一化组成。卷积操作有助于提取图像中的特征,而池化层则用于逐渐减小图像的尺寸和通道数。编码器的堆叠卷积层使图像尺寸缩小,同时特征通道数量增多。具体如下:
首先输入样例是单通道的,通过一个3*3的卷积核和ReLU操作(步距为1),并且无padding。然后进行下采样,进行最大池化,并使其通道翻倍,再次进行下采样,最大池化,再次使通道翻倍。它由收缩路径(左侧)和扩张路径(右侧)组成。收缩路径遵循卷积网络的典型架构。它包括重复应用两个3x3卷积(未填充卷积),每个卷积后接一个整流线性单元(ReLU)和2x2最大值合并操作,步长2用于下采样。在每个下采样步骤中,我们使特征通道数翻倍。扩展路径中的每个步骤包括特征映射的上采样,随后是将特征通道数量减半的2x2卷积(“上卷积”),与来自收缩路径的相应裁剪特征映射的级联,以及两个3x3卷积,每个卷积后跟一个ReLU。由于每个卷积中边界像素的丢失,裁剪是必要的。在最后一层,使用1x1卷积将每个64分量特征向量映射到期望数目的类。网络共有23个卷积层。
后半,在下文介绍....