图像语义分割(1)-FCN:用于语义分割的全卷积神经网络

最新推荐文章于 2024-06-19 22:38:11 发布

不会算命的赵半仙

最新推荐文章于 2024-06-19 22:38:11 发布

阅读量1.6k

点赞数

分类专栏：深度学习语义分割文章标签：深度学习语义分割

本文链接：https://blog.csdn.net/kevin_zhao_zl/article/details/84342429

版权

深度学习同时被 2 个专栏收录

49 篇文章 9 订阅

订阅专栏

语义分割

34 篇文章 13 订阅

订阅专栏

欢迎扫描二维码关注微信公众号 深度学习与数学 [获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读，算法和其他互联网技能的学习，概率论、线性代数等高等数学知识的回顾]
在这里插入图片描述
论文地址：Fully Convolutional Networks for Semantic Segmentation
[Long J , Shelhamer E , Darrell T . Fully Convolutional Networks for Semantic Segmentation[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2014, 39(4):640-651.]
论文实现：github代码

1. 创新

接收任意尺寸输入的全卷积网络
使用反卷积的上采样
融合深层粗糙特征和浅层精细特征的跳跃结构

2.模型提出

为什么可以将CNN转化为FCN？
全连接层可以看作卷积层，其中，feature map 1x1，向量长度为通道数。
为什么需要上采样？
端到端的密集预测需要输入和输出的尺寸一致，而提取特征图的过程中图像像素降低，感受野变大，输出尺寸与输入不一致。
为什么需要跳跃结构进行跨层特征融合？
深层的特征对应全局的语义信息，浅层的特征对应着目标的位置信息，语义分割二者都需要考虑，所以引入了跳跃结构。

3.模型架构

3.1 调整分类网络至全卷积以进行稠密预测

将全连接层替换为卷积层，如图：
在这里插入图片描述

3.2 使用反卷积的上采样

为了还原图像的尺寸，文章中提出了三种方法，即稀疏滤波(Shift-and-stitch)、双线性插值、和反卷积， 并采用了反卷积的方法。反卷积是与卷积操作相反的计算，比如下图是普通的卷积，4x4 Input、3x3 KernelSize、0 pad、1 stride：
在这里插入图片描述
反卷积将卷积还原：2x2 Input、3x3 KernelSize、0 pad、1 stride，如图：

在TensorFlow框架中，反卷积过程如下：

3.3 跨层结构(skip architecture)

首先贴上论文中的结构图：
在这里插入图片描述
首先是基础的五步操作：

Input $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo1:: $\frac{1}{2}$ Input
pool1 $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo2:: $\frac{1}{4}$ Input
pool2 $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo3:: $\frac{1}{8}$ Input
pool3 $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo4:: $\frac{1}{16}$ Input
pool4 $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo5:: $\frac{1}{32}$ Input
应用跳跃结构得到三种不同的模型：
直接对 pool5 进行 32x 上采样后，将得到的特征图扔给Softmax分类器，得到密集预测结果 $\rightarrow$ FCN-32s
对 pool5 进行 2x 上采样得到与 pool4 尺寸一样的上采样特征，并于 pool4 逐点相加得到特征图，对此特征图进行 16x 上采样，将得到的特征图扔给Softmax分类器，得到密集预测结果 $\rightarrow$ FCN-16s
对 pool5 进行 2x 上采样得到与 pool4 尺寸一样的上采样特征，对此特征进行 2x 上采样得到与 pool3 尺寸一样的上采样特征，并于 pool3 逐点相加得到特征图，对此特征图进行 8x 上采样，将得到的特征图扔给Softmax分类器，得到密集预测结果 $\rightarrow$ FCN-8s