论文地址:V-Net: Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation
V-Net相当于对于3D U-Net的变形
整体网络结构如图
有几点改进:
1、首先网络使用的ResNet中的残差网络(Redisual Network)
2、下采样层将MaxPooling全部替换成了卷积核为2*2*2,stide为2的conv层
文中说这么做的目的是为了减少占用内存,是因为进行maxpool的时候,会记住传递到下一层的单元格索引,以便反向传播,pool层反向传播的过程请见https://blog.csdn.net/qq_21190081/article/details/72871704
3、使用了PReLu非线性激活函数
4、每层卷积层的都使用5*5*5的卷积核,并且使用合适的padding使输入输出的图像大小一致
5、使用Dice overlap coefficient
本文提出之前的如U-net使用权重来平衡前景图和背景图的关系,不这样做的话会容易进入trap,本文提出基于dice的构造函数
其中p为预测的前景图,g为ground truth
6、shortcut和U-Net相同