一、前言
在上篇文章为大家介绍了语义分割的基本概念,以及传统方法和深度学习代表方法各自的问题,以及语义分割的常用数据集、常用评价指标。可参考:
二、语义分割介绍
语义分割,简单地说,分割就是抠图。语义分割,就是按图像中物体表达的含义进行抠图。相比传统的目标识别,语义分割它更强大。语义分割模型不仅可以识别简单的类别,而且还可以进行多目标、多类别、复杂目标以及分割目标。截至到2017年底,我们已经分化出了数以百计的模型结构。当然,经过从技术和原理上考究,我们发现了一个特点,那就是当前最成功的图像分割深度学习技术都是基于一个共同的先驱:FCN(Fully Convolutional Network,全卷积神经网络)。
三、FCN
3.1 FCN论文概括
- 主要成就:端到端、像素到像素训练方式下的卷积神经网络超过了现有语义分割方向最先进的技术。
- 核心思想:搭建了一个全卷积网络,输入任意尺寸的图像,经过有效推理和学习得到相同尺寸 的输出。
- 主要方法:将当前分类网络改编成全卷积网络(AlexNet、VGGNet和GoogLeNet)并进行微调设计了跳跃连接将全局信息和局部信息连接起来,相互补偿。