编解码结构其实就是指整个网络中存在一个主要的编码器块和解码器块。编码器块主要用来从输入中提取特征图谱,而解码器块主要是将经过编码器处理的输入所得到的特征进行进一步的特征优化和任务处理。
U-net
专门为医学图像所提出的分割网络。将图像->高语义feature map的过程看成编码器,高语义->像素级别的分类score map的过程看作解码器。在FCN中,Skip connection的联合是通过对应像素的求和,而U-Net则是对其的channel的concat过程。
SegNet
为了更好的保留边界特征信息。采用了索引的方式进行上采样。即在进行池化操作时,记录池化所取值的位置,在上采样时直接用当时记录的位置进行UpPool(反池化)
import torch
import torchvision
import torch.nn