深度学习论文笔记(七)---Deconvolution network
Learning Deconvolution Network for Semantic Segmentation
Author:H Noh , S Hong , B Han
Year:2016
1、 导引
2015年提出的FCN网络在Semantic segmentation上取得了较好的成绩,但是依然存在两个较为突出的缺点:
①First, the network has a predefined fixed-size receptive field.
所以那些大于或者小于感受野的目标,就可能被分裂或者错误标记。具体点来说,对于大目标,进行预测时只使用了local information所以可能会导致属于同一个目标的像素被误判为不连续的标签(即不同目标),如下图,左侧为input,中间为ground truth,右侧为result,可见这个大巴由于too large所以被分割成了很多不连续的部分。
而对于小目标来说,经常会被忽略掉,就是被当作了背景了。如下图,左侧为input,中间为ground truth,右侧为result。由于人很远所以在图中面积too small,结果被当作背景了:
②目标的细节结构常常丢失或者被平滑处理掉,
所以输入deconvolution-layer的label map就太粗糙了,而且deconvolution 这个步骤在FCN这篇文章中做的过于简单了。
缺少一个在大量数据上得到训练的deconvolution network使得准确地重构物体边界的高维非线性结构变得困难。
针对上面的两个limitations,这篇文章提出的贡献有:
• We learn a deep deconvolution network, which is composed of deconvolution, unpooling, and rectified linear unit (ReLU) layers.
• 经过训练的网络被用于单个物体以获得 instance-wise(就是样例水平上)的分割,并最终和语义分割结合起来。
• 在PASCAL VOC 2012数据集上取得的效果很nice。