1.1 全卷积神经网络(Fully Convolutional Networks, FCN)
基于传统的卷积神经网络的分割方法通常是:为了对一个像素分类,使用该像素周围的图像块作为网络的输入。这种方法有几个缺点:
1、存储开销很大。如果对每个像素使用的图像块的大小为15x15,则所需的存储空间为原来图像的225倍。
2、计算效率低下。因为相邻像素块重复,计算机需要做大量的重复计算,所以导致计算效率低下。
3、感受野太小,无法获取全局信息。通常像素块的大小比整幅图像小很多,因此算法只能提取一些局部的特征信息,从而导致分类的性能受到限制。
针对上述问题, Long Jonathan等人[2]2015年提出全卷积网络(Fully Convolutional Networks, FCN)结构。FCN可以对图像进行像素级的分类,从而解决了语义级别的图像分割问题。与经典的卷积神经网络在卷积层之后使用全连接层得到固定长度的特征向量进行分类不同,FCN可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。FCN网络结构图如图1-1所示: