Keras深度学习实战(18)——语义分割详解
0. 前言
在《使用 U-Net 架构进行图像分割》一节中,我们学习图像分割的基本概念,并且构建了基于 U-Net
网络模型的图像分割模型,在图像中仅包含一个对象时实现图像分割的方法。在本节中,我们将更进一步学习更复杂的语义分割,以便我们能够区分图像中的多个对象。
1. 语义分割基本概念
语义分割 (Semantic Segmentation
) 是为了便于图像分析而为图像中的每个像素分配标签的过程,可以将语义分割认为是一种为场景理解提供支持的高层任务,场景理解不仅是语义分割领域需要解决的重难点问题,更是计算机视觉领域的核心问题之一。
语义分割在包括自动驾驶、行人检测和医学影像分析等领域显示出良好的应用前景。语义分割技术主要包括两类:第一类是传统的语义分割算法,首先需要使用传统的图像处理技术提取图像特征,然后通过为每个像素分类来实现图像分割,此类方法的优点在于操作简单,计算难度较小,但其适用性较低,在有外界因素(例如光照、旋转等)的干扰下分割效果不佳;第二类是基于深度学习的语义分割算法,通过使用深度卷积神经网络提取图像特征,然后对每个像素进行分类&#x