通俗易懂理解FCN全卷积网络模型

温故而知新,可以为师矣!

一、参考资料

深度学习笔记(二十三)Semantic Segmentation(FCN/U-Net/PSPNet/SegNet/U-Net++/ICNet/DFANet/Fast-SCNN)

二、FCN相关介绍

1. FCN简介

全卷积神经网络(Fully Convolutional Networks, 简称FCN),是利用深度学习进行语义分割的开山之作。FCN将传统的分类网络改造成分割网络:替换全连接层为卷积层,利用转置卷积进行上采样获得高分辨率的语义特征图,输出 feature map 的每一维通道预测一个类别的分割结果。

FCN主要用来做 pixel-wiseimage segmentation 预测,先用传统的CNN结构得到 feature map, 再将传统的 full connected 转换成了对应参数的卷积层。比如,传统pool5层的尺寸是7×7×512,fc6的尺寸是4096, full connected weight 是7×7×512×4096;将全连接层转成卷积层,kernel size 为7×7,input channel 为512,output channel 为4096,这就实现了将传统的网络(分别带有卷积层和全连接层)转成了全卷积网络(fully convolutional network, FCN)。简单理解,FCN全卷积网络就是全部都由卷积层构成的网络,没有FC层

FCN的一个好处是输入图片尺寸可以任意,不受传统网络全连接层尺寸限制,传统的方法还要用类似SPP结构来避免这个问题。FCN中为了得到 pixel-wise 的prediction,也要把 feature map 通过转置卷积转化到像素空间。

2. FCN网络结构

FCN大致网络结构如下:

在这里插入图片描述

上图模型结构为针对VOC数据集的21个语义分割,即数据集包含21种不同分割类型。当图像进入神经网络,第一个卷积层将图像由三通道转换为96通道 feature map,第二个卷积层转换为256个通道,第三个卷积层384个通道,直到最后一个卷积层变为21个通道,每个通道对应不同分割类型。实际上,卷积层整个网络结构中卷积层的通道数可以根据不同任务进行调整,前面每经过一层会对图像进行一次宽高减半的下采样,经过5个卷积层以后,feature map 的尺寸为输入的1/32,最后通过转置卷积将 feature map 宽高恢复到原始输入图像尺寸。

3. FCN网络结构分解

FCN模型结构可以根据分割细粒度使用FCN32s、FCN16s、FCN8s等结构,32s即从32倍下采样的 feature map 恢复到原始输入尺寸,16s和8s则是从16倍和8倍下采样恢复到原始输入尺寸,当然还可以使用4s、2s结构,数字越小使用的转置卷积层进行上采样越多,对应模型结构更加复杂,理论上分割的效果更精细

3.1 FCN32s模型结构

FCN32s模型结构示意图:

在这里插入图片描述

3.2 FCN16s模型结构

FCN16s模型结构示意图:

在这里插入图片描述

3.3 FCN8s模型结构

FCN8s模型结构示意图:

在这里插入图片描述

4. FCN的特征融合(Add)

在FCN论文中,作者采用对 low-levelhigh-level 特征进行融合的方式。这是因为:

  1. 网络比较深的时候,特征图尺寸通常比较小,对这种特征图进行上采样,有很好的语义信息,但分辨率很差。
  2. 网络比较浅的时候,特征图尺寸通常比较大(接近input image),对这种特征图进行上采样,有很好的细节,但语义信息很差。

因此,对 low-levelhigh-level 特征进行融合,可以在得到很好的细节基础上,也能获得尽可能强的图像语义信息。

三、相关经验

(MindSpore)代码实现

图像语义分割网络FCN(32s、16s、8s)原理及MindSpore实现

(TensorFlow)代码实现

github代码:tensorflow-fcn

四、参考文献

Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 3431-3440.

  • 18
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
FCN卷积神经网络)是一种神经网络结构,它的特点是可以接收任意大小的输入图片,而不需要固定大小。相比于传统的CNN(卷积神经网络),FCN在较深的卷积层中融入了浅层卷积的特征,并且使用了三种上采样的方式来恢复原始图片的尺寸,其中FCN-8s是效果最好的一种方式。 与CNN不同,FCN将CNN中的连接层替换为卷积操作,这种操作被称为1x1卷积。这样做的目的是为了保持空间信息的完整性,使得网络能够对输入图片的每个像素进行预测,而不仅仅是对整个图片进行分类。 总之,FCN卷积神经网络通过融入浅层卷积特征和使用1x1卷积操作,实现了对任意大小图片的处理,并且在图像语义分割等任务中取得了良好的效果。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [卷积神经网络FCN](https://blog.csdn.net/zqqbb7601/article/details/120704827)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [卷积神经网络(FCN)](https://blog.csdn.net/qq_37497304/article/details/126599402)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

花花少年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值