全卷积网络（FCN）实战：使用FCN实现语义分割

最新推荐文章于 2023-06-09 09:16:54 发布

www_xuhss_com

最新推荐文章于 2023-06-09 09:16:54 发布

阅读量316

点赞数

分类专栏： it 文章标签： python

本文链接：https://blog.csdn.net/www_xuhss_com/article/details/123571915

版权

Python微信订餐小程序课程视频

https://edu.csdn.net/course/detail/36074

Python实战量化交易理财系统

https://edu.csdn.net/course/detail/35475

**摘要：**FCN对图像进行像素级的分类，从而解决了语义级别的图像分割问题。

本文分享自华为云社区《全卷积网络（FCN）实战：使用FCN实现语义分割》，作者： AI浩。

FCN对图像进行像素级的分类，从而解决了语义级别的图像分割（semantic segmentation）问题。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类（全联接层＋softmax输出）不同，FCN可以接受任意尺寸的输入图像，采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸，从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。

下图是语义分割所采用的全卷积网络(FCN)的结构示意图：

传统的基于CNN的分割方法缺点？

传统的基于CNN的分割方法：为了对一个像素分类，使用该像素周围的一个图像块作为CNN的输入，用于训练与预测，这种方法主要有几个缺点：

1）存储开销大，例如，对每个像素使用15 * 15的图像块，然后不断滑动窗口，将图像块输入到CNN中进行类别判断，因此，需要的存储空间随滑动窗口的次数和大小急剧上升；

2）效率低下，相邻像素块基本上是重复的，针对每个像素块逐个计算卷积，这种计算有很大程度上的重复；

3）像素块的大小限制了感受区域的大小，通常像素块的大小比整幅图像的大小小很多，只能提取一些局部特征，从而导致分类性能受到限制。而全卷积网络(FCN)则是从抽象的特征中恢复出每个像素所属的类别。即从图像级别的分类进一步延伸到像素级别的分类。

FCN改变了什么?

对于一般的分类CNN网络，如VGG和Resnet，都会在网络的最后加入一些全连接层，经过softmax后就可以获得类别概率信息。但是这个概率信息是1维的，即只能标识整个图片的类别，不能标识每个像素点的类别，所以这种全连接方法不适用于图像分割。

而FCN提出可以把后面几个全连接都换成卷积，这样就可以获得一张2维的feature map，后接softmax层获得每个像素点的分类信息，从而解决了分割问题，如图。

FCN缺点

（1）得到的结果还是不够精细。进行8倍上采样虽然比32倍的效果好了很多，但是上采样的结果还是比较模糊和平滑，对图像中的细节不敏感。（2）对各个像素进行分类，没有充分考虑像素与像素之间的关系。忽略了在通常的基于像素分类的分割方法中使用的空间规整（spatial regularization）步骤，缺乏空间一致性。

数据集

本例的数据集采用PASCAL VOC 2012 数据集，它有二十个类别：

**Person:**person

**Animal:**bird, cat, cow, dog, horse, sheep

**Vehicle:**aeroplane, bicycle, boat, bus, car, motorbike, train

**Indoor:**bottle, chair, dining table, potted plant, sofa, tv/monitor

下载地址：The PASCAL Visual Object Classes Challenge 2012 (VOC2012) (ox.ac.uk)。

数据集的结构：

VOCdevkit
 └── VOC2012
 ├── Annotations 所有的图像标注信息(XML文件)
 ├── ImageSets 
 │ ├── Action 人的行为动作图像信息
 │ ├── Layout 人的各个部位图像信息
 │ │
 │ ├── Main 目标检测分类图像信息
 │ │ ├── train.txt 训练集(5717)
 │ │ ├── val.txt 验证集(5823)
 │ │ └── trainval.txt 训练集+验证集(11540)
 │ │
 │ └── Segmentation 目标分割图像信息
 │ ├── train.txt 训练集(1464)
 │ ├── val.txt 验证集(1449)
 │ └── trainval.txt 训练集+验证集(2913)
 │ 
 ├── JPEGImages 所有图像文件
 ├── SegmentationClass 语义分割png图（基于类别）
 └── SegmentationObject 实例分割png图（基于目标）

数据集包含物体检测和语义分割，我们只需要语义分割的数据集，所以可以考虑把多余的图片删除，删除的思路：

1、获取所有图片的name。

2、获取所有语义分割mask的name。

3、求二者的差集，然后将差集的name删除。

代码如下：

import glob
import os
image\_all = glob.glob('data/VOCdevkit/VOC2012/JPEGImages/*.jpg')
image\_all\_name = [image\_file.replace('\\',

最低0.47元/天解锁文章

www_xuhss_com

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
全卷积网络（FCN）实战：使用FCN实现语义分割

Python微信订餐小程序课程视频https://edu.csdn.net/course/detail/36074Python实战量化交易理财系统https://edu.csdn.net/course/detail/35475**摘要：**FCN对图像进行像素级的分类，从而解决了语义级别的图像分割问题。本文分享自华为云社区《全卷积网络（FCN）实战：使用FCN实现语义分割》，作者： AI浩。FCN对图像进行像素级的分类，从而解决了语义级别的图像分割（semantic segmentation
复制链接

扫一扫