语义分割—对FCN、U-Net、SegNet的一点理解
最近在看语义分割的论文,有很多高级的方法,今天再回味了一下语义分割元老级的一些方法,在这里只写大概的理解,详细内容还是建议看论文
FCN
FCN是元老,提出了全卷积网络,将原本网络顶层的全连接结构用卷积结构代替。这样就将原本输出的一维向量改为二维特征图的形式,保存了二维信息。实现语义分割还需将特征图上采样到与原图对应的size,这里问题就出现了。
FCN-8s:为了解决FCN直接上采样的问题,FCN-32s、-16s、-8s采用反卷积的方法,一步步对特征图进行上采样,并且借鉴特征提取部分相应尺度的特征图(这里的借鉴操作为:特征图copy过来、与刚刚进行过deconv的特征图进行对应像素add)
FCN-32s:deconv(featureMap16_16, stride=32) --> output: 512_512
FCN-16s:temp = add(deconv(featureMap16_16, stride=2),pool4)
deconv(16s:temp, stride&