论文链接:SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation
caffe代码:https://github.com/TimoSaemann/caffe-segnet-cudnn5
工程主页:http://mi.eng.cam.ac.uk/projects/segnet/
本篇论文使用了对称的Encoder-Decoder网络结构来实现语义分割,如下图:
基于VGG16的对称网络结构,网络把全卷积层去掉了,这样就可实现end-to-end的训练,节省计算时间。
论文中提到如果把encoder卷积层的信息加入到decoder中会提高准确率,但是运算消耗增加,因此作者并没有这么做,采用了一种Unpooling的方法,如下图