- 研究方法
在本文中提出一种浅层U-Net网络结构,使用ImageNet上预训练的VGG19编码器替换其原编码器,网络结构如图 1所示,该模型包括两个路径,左侧收缩路径和右侧扩展路径,通过收缩路径中的卷积和池化来聚合上下文信息,通过扩展路径中的卷积和上采样来恢复完整图像分辨率。其中网络共14层,可训练参数1 605 961个,步幅固定为2。使用前两个VGG19卷积块作为收缩路径,并每个卷积层的激活函数使用修正线性单元(ReLU)。相对于对称的扩展路径而言,在每个卷积层之后安排ReLU和批归一化(BN)。由于每次卷积后边界像素的丢失,因此裁剪是必要的。通过连续的卷积和池化,卷积层可以整合的上下文信息从区域到全局尺度,因此降低了输出层的分辨率,在扩展路径中将池化替换为上采样这样做为了解决多尺度信息融合和全分辨率像素分类之间的冲突。来自收缩路径的高分辨率特征与上采样输出相结合。在最后一层,使用1×1卷积来映射每个64分量的特征向量,并且每个元素表示对应的输入像素属于肿瘤的概率,下面详细介绍网络结构中所做的改进。
图1.网络结构
在本文中,VGG19编码器中只使用VGG19的block1和block2,每个block包含两个卷积层。