2 Related work
我们的方法利用最近成功的deep nets for图像分类[20, 31, 32]和迁移学习[3, 38]. 迁移先使用在识别[3, 38],然后到检测和语义分割[10, 15, 13]. 我们重新构建和调制一个分类网络,dense prediction of语义分割。
现在有很多工作,运用convnet去dense prediction,包括语义分割[27,7,28],电子显微镜边界预测[2]和自然图像边界[9] ,图像的复原和深度估计[4,5],这些方法通用的元素是:
- 小的模型限制容量和接收域
- patchwise训练 [27, 2, 7, 28, 9]
- 后处理有超像素,随机场,滤波或局部分类[7, 2, 9]
- 输入平移和输出交错for dense output[29,28, 9]
- 多尺度金字塔处理 [7, 28, 9]
- tanh非线性[7, 4, 28]
- ensembles[2, 9]
然而,我们的方法,没有这些机制,我们在3.4 patchwise training,在3.2 ''shift-and-stitch" dense output,我们也在3.3讨论了in-network上采样。
不像这些存在的方法,我们改编和延伸深度分类的结构,使用图像分类作为监督的预训练,fine-tune全卷积从整个输入图像和图像的ground truth去学习简单和高效。