语义分割是将标签分配给图像中的像素。
一、图像分类与语义分割不同点?
池化层可以增加感受野,同时减少特征图的分辨率。这对于分类来说十分有效,其对象的空间位置无关重要,并能提取出更多抽象、突出的特征。然而,池化和带步长的卷积对语义分割是不利的,因为降低特征图分辨率意味着空间信息的丢失,如精确的边缘形状。因此语义分割提出的几种典型的网络都致力于恢复编码器中因降低分辨率而丢失的信息。
二、语义分割方法
经典方法包括灰度分割、条件随机场CRF等。
近几年提出的深度学习语义分割架构大致分为两种:
1)一般是encoder-decoder网络。编码器通常是一个预训练的分类网络,如VGG16、ResNet。主要区别在于解码器,其任务是将编码器学习到的可判别特征(较低分辨率)从语义上投影到像素空间(具有较高分辨率),以获得密集分类。
1、FCN Fully Convolution Network