语义分割网络-FCN全卷积网络

全卷积神经网络FCN整体概述

FCN是首个端对端针对像素级预测的全卷积网络。FCN会用到分类网络作为backbone
FCN的网络结构类比分类网络

分类网络经过卷积操作后,接全连接层,最后一个全连接层输出长度与分类类别数量相同,最后经过softmax得到术语每个类别的概率。

对于FCN网络,特征提取会用到分类网络作为backbone。类比分类网络,FCN-s32经过一系列卷积操作(下采样)获取特征层,卷积最终输出特征层与语义分割类别数num_cls相等(包含背景),再通过convTranspose反卷积(上采样),得到与原图相同大小的特征图,通道数与num_cls相等。特征图上的每一个像素点在channel维度上对应channel个值,进过softmax得到每一个像素点在所有类别上的概率值,取概率最大值作为该像素点的预测类别。


FCN网络结构

以VGG16为FCN的backbne
VGG16网络结构如下图所示:
VGG16网络结构图
FCN-8s和FCN-16s使用到第3个max pooling和第四个max pooling特征层,分别对应原始图片宽高的1/8和1/16
(理解FCN-8s最后特征层经过8倍上采样, FCN-16s最后特征层经过16倍上采样)

FCN-32S网络结构

FCN-32S网络结构
图片来自
https://www.bilibili.com/video/BV1J3411C7zd/?spm_id_from=333.788&vd_source=91cfed371d5491e2973d221d250b54ae*

如上图所示,在backbone特征提取模块使用是VGG16模型中全连接网络之前的所有卷积模块,FC6表示连接一个7×7卷积、激活函数和dropout,特征层大小不变;
FC7表示连接一个1×1卷积、激活函数和dropout,特征层大小不变;
再经过一个1×1卷积,不改变特征层大小,将channel数量转换为与num_cls相同;
经过反卷积(上采样),将特征图上采样32倍得到与原始图片相同大小的特征层;
(如果训练过称重反卷积参数冻结,等于对特征图做双线性插值处理)
得到语义分割结果

FCN-16S网络结构

FCN-16S网络结构
图片来自
https://www.bilibili.com/video/BV1J3411C7zd/?spm_id_from=333.788&vd_source=91cfed371d5491e2973d221d250b54ae*

FCN-16s在反卷积结果中融合了backbone中的特征层。
使用VGG16第四个池化后的特征层(原始图像宽高1/16)进过一次1×1卷积将channel数转化为num_cls,
与两倍上采样后的卷积结果相加(特诊层对应位置像素值相加操作),
融合后的结果进行反卷积(16倍上采样),
输出特征层,得到语义分割结果。

FCN-8S网络结构

FCN-8S网络结构
FCN-8s在反卷积结果中融合了backbone中的特征层。
使用VGG16第四个池化后的特征层(原始图像宽高1/16)进行一次1×1卷积将channel数转化为num_cls,
与两倍上采样后的卷积结果相加(特征层对应位置像素值相加操作),
将结果再次两倍上采样,再与VGG16第三个池化后的特征层(原始图像宽高1/8)进行一次1×1卷积将chnnel数量转化为num_cls相加(特征层对应位置像素值相加操作),
融合后的结果进行反卷积(8倍上采样),
输出特征层,得到语义分割结果。

在这里插入图片描述

以上为全卷积神经网络FCN网络结构笔记


感谢:
https://www.bilibili.com/video/BV1J3411C7zd/?spm_id_from=333.788&vd_source=91cfed371d5491e2973d221d250b54ae

  • 14
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值