因为你 所以我
Contents
-
- 1 网络整体结构
- 2 Key points
- 2.1 Overlap-tile Strategy
- 2.2 Decode中的上采样
- 2.2.1 UnPooling
- 2.2.2 UpSampling
- 2.2.3 反卷积
- 3 UNet++
- 4 深度监督(Deep supervision)
开始之前学习一个单词热热身: contracting v. 收缩,缩小; (肌肉)收缩;感染(疾病);
1 网络整体结构
UNet论文中对于网络结构总结最好的一句话: The architecture consists of a contracting path (理解为降采样路径,编码)to capture context and a symmetric expanding path (理解为上采样路径,编码)that enables precise localization. 神经网络层数越深,其特征图尺寸越小,其包含的语义信息越丰富,而损失了物体的位置信息;再结合FPN的思想把大特征图中包含的位置信息与小特征图中包含的语义信息concat起来,这样就弥补了定位精度与语义信息间的tradeoff
,多好。
从图片中看到整体的网络结构类似
U
型,其左边和右边分别为
Encoder
和
Decoder
过程:
- Encoder:左半部分,由两个3x3的卷积层(ReLU)+2x2的max polling层(stride=2)反复组成,每经过一次下采样,通道数翻倍;
- Decoder:右半部分,由一个2x2的上采样卷积层(ReLU)+ Concatenation(crop对应的Encoder层的输出feature map然后与Decoder层的上采样结果相叠加)+ 2个3x3的卷积层(ReLU)反复构成;
- 最后一层通过一个1x1卷积将通道数变成期望的类别数。
[W,H,num_cls+1]
,其中 <