2015 CVPR
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Robust Semantic Pixel-Wise Labelling
Introduce
SegNet 是一个encoder-decoder结构的卷积神经网络.
- Cambridge提出
- 解决自动驾驶或者智能机器人的图像语义分割深度网络
- 基于FCN,修改VGG-16网络
- 有两种,分别为SegNet与Bayesian SegNet
- end to end
SegNet和FCN思路十分相似:
- 只是Encoder,Decoder(Upsampling)使用的技术不一致。
- SegNet的编码器部分使用的是VGG16的前13层卷积网络,每个编码器层都对应一个解码器层,最终解码器的输出被送入soft-max分类器以独立的为每个像素产生类概率。
Network
- 左边是卷积提取特征,通过pooling增大感受野,同时图片变小,该过程称为En