关于全卷积网络FCN的一些学习

最新推荐文章于 2022-04-25 23:37:52 发布

逐蚀

最新推荐文章于 2022-04-25 23:37:52 发布

阅读量181

点赞数

本文链接：https://blog.csdn.net/weixin_46078215/article/details/118407197

版权

前言

本文中关于FCN的学习主要参考了下面这篇文章。

文章链接：https://zhuanlan.zhihu.com/p/31428783

一、什么是FCN

图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像理解的重要一环，也是 AI 领域中一个重要的分支。语义分割即是对图像中每一个像素点进行分类，确定每个点的类别（如属于背景、人或车等），从而进行区域划分。目前，语义分割已经被广泛应用于自动驾驶、无人机落点判定等场景中。

二、FCN与CNN的区别

对于一般的分类CNN网络，如VGG和Resnet，都会在网络的最后加入一些全连接层，经过softmax后就可以获得类别概率信息。但是这个概率信息是1维的，即只能标识整个图片的类别，不能标识每个像素点的类别，所以这种全连接方法不适用于图像分割。

三、FCN的结构

整个FCN网络基本原理如图5（只是原理示意图）：

image经过多个conv和+一个max pooling变为pool1 feature，宽高变为1/2
pool1 feature再经过多个conv+一个max pooling变为pool2 feature，宽高变为1/4
pool2 feature再经过多个conv+一个max pooling变为pool3 feature，宽高变为1/8
......
直到pool5 feature，宽高变为1/32。

那么：

对于FCN-32s，直接对pool5 feature进行32倍上采样获得32x upsampled feature，再对32x upsampled feature每个点做softmax prediction获得32x upsampled feature prediction（即分割图）。
对于FCN-16s，首先对pool5 feature进行2倍上采样获得2x upsampled feature，再把pool4 feature和2x upsampled feature逐点相加，然后对相加的feature进行16倍上采样，并softmax prediction，获得16x upsampled feature prediction。
对于FCN-8s，首先进行pool4+2x upsampled feature逐点相加，然后又进行pool3+2x upsampled逐点相加，即进行更多次特征融合。具体过程与16s类似，不再赘述。

作者在原文种给出3种网络结果对比，明显可以看出效果：FCN-32s < FCN-16s < FCN-8s，即使用多层feature融合有利于提高分割准确性。

总结：

以上便是项目实训的第二篇日志。

逐蚀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于全卷积网络FCN的一些学习

目录前言一、什么是FCN二、FCN与CNN的区别三、FCN的结构总结：前言本文中关于FCN的学习主要参考了下面这篇文章。文章链接：https://zhuanlan.zhihu.com/p/31428783一、什么是FCN图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像理解的重要一环，也是 AI 领域中一个重要的分支。语义分割即是对图像中每一个像素点进行分类，确定每个点的类别（如属于背景、人或车等），从而进行区域划分。目
复制链接

扫一扫