通俗易懂理解FCN全卷积网络模型

花花少年

已于 2024-01-26 18:28:32 修改

阅读量1.2k

点赞数 18

分类专栏：深度学习文章标签： FCN 全卷积网络

于 2024-01-24 08:56:23 首次发布

本文链接：https://blog.csdn.net/m0_37605642/article/details/135813375

版权

深度学习专栏收录该内容

117 篇文章 79 订阅

订阅专栏

温故而知新，可以为师矣！

一、参考资料

深度学习笔记（二十三）Semantic Segmentation(FCN/U-Net/PSPNet/SegNet/U-Net++/ICNet/DFANet/Fast-SCNN)

二、FCN相关介绍

1. FCN简介

全卷积神经网络(Fully Convolutional Networks, 简称FCN)，是利用深度学习进行语义分割的开山之作。FCN将传统的分类网络改造成分割网络：替换全连接层为卷积层，利用转置卷积进行上采样获得高分辨率的语义特征图，输出 feature map 的每一维通道预测一个类别的分割结果。

FCN主要用来做 pixel-wise 的 image segmentation 预测，先用传统的CNN结构得到 feature map，再将传统的 full connected 转换成了对应参数的卷积层。比如，传统pool5层的尺寸是7×7×512，fc6的尺寸是4096， full connected weight 是7×7×512×4096；将全连接层转成卷积层，kernel size 为7×7，input channel 为512，output channel 为4096，这就实现了将传统的网络（分别带有卷积层和全连接层）转成了全卷积网络(fully convolutional network, FCN)。简单理解，FCN全卷积网络就是全部都由卷积层构成的网络，没有FC层。

FCN的一个好处是输入图片尺寸可以任意，不受传统网络全连接层尺寸限制，传统的方法还要用类似SPP结构来避免这个问题。FCN中为了得到 pixel-wise 的prediction，也要把 feature map 通过转置卷积转化到像素空间。

2. FCN网络结构

FCN大致网络结构如下：

在这里插入图片描述

上图模型结构为针对VOC数据集的21个语义分割，即数据集包含21种不同分割类型。当图像进入神经网络，第一个卷积层将图像由三通道转换为96通道 feature map，第二个卷积层转换为256个通道，第三个卷积层384个通道，直到最后一个卷积层变为21个通道，每个通道对应不同分割类型。实际上，卷积层整个网络结构中卷积层的通道数可以根据不同任务进行调整，前面每经过一层会对图像进行一次宽高减半的下采样，经过5个卷积层以后，feature map 的尺寸为输入的1/32，最后通过转置卷积将 feature map 宽高恢复到原始输入图像尺寸。

3. FCN网络结构分解

FCN模型结构可以根据分割细粒度使用FCN32s、FCN16s、FCN8s等结构，32s即从32倍下采样的 feature map 恢复到原始输入尺寸，16s和8s则是从16倍和8倍下采样恢复到原始输入尺寸，当然还可以使用4s、2s结构，数字越小使用的转置卷积层进行上采样越多，对应模型结构更加复杂，理论上分割的效果更精细。