语义分割总结

最新推荐文章于 2024-07-26 15:57:18 发布

hutanglove

最新推荐文章于 2024-07-26 15:57:18 发布

阅读量5.8k

点赞数 3

分类专栏：图像分割

图像分割专栏收录该内容

2 篇文章 1 订阅

订阅专栏

目前看过的论文有FCN，U-net，还有几个经典网络没有看，看论文速度有待提高，赶紧还债，下面是我对几个语义分割网络的简单理解，后期会补充。另，建议关注一个类似知乎的国外精英网站：Qure）
参考来源：A 2017 Guide to Semantic Segmentation with Deep Learning
在FCN网络在2104年提出后，越来越多的关于图像分割的深度学习网络被提出，相比传统方法，这些网络效果更好，运算速度更快，已经能成熟的运用在自然图像上。
大致分为三部分：介绍语义分割问题，回顾语义分割方法，介绍一个有趣的网络算法。

1 什么是语义分割？

语义分割是在像素级别的水平上理解图像，为每个像素标记一个特定类别，比如下面一张图像

这里写图片描述

除了识别摩托车和骑手，我们还要划定目标边界，因此不同于分类问题，我们需要像素密度预测。
两个比较常用的语义分割数据集为：VCO2012 和 MSCOCO

在使用深度网络之前传统的算法有TextonForest 和 Random Forest based classifiers。和分类问题一样，CNN在图像分割方面也获得了巨大成功。

其中最开始的一个算法是基于图像块的分类（patch classification(http://people.idsia.ch/~juergen/nips2012.pdf)），每个像素根据它所在的像素块被分类。使用像素块原因是分类网络通畅以整幅图像作为输入，所以我们以图像块代表一个像素进而得到像素类别。
在2014年，Long等人提出全卷积网络（FCN），FCN是一个著名的CNN结构的像素密度预测网络，该网络的特点是没有全连接层，而是直接输出分割结果，这可以使网络输出任意大小的分割图，几乎所有以后算法都采用了这种范式。
除了全连接网络，CNN的另一个问题是池化层。池化层增加了视野，能够在忽略“where”信息的情况下聚合上下文。然而，语义分割要求分类图精确校正，因此需要保存“where”信息。在论文中提出了两种不同的分类架构。
第一种就是编码-解码结构。编码过程会通过池化操作逐渐降低空间尺度，而解码过程则会逐渐恢复目标细节和空间。在编码解码之间通常会有快捷连接来增加细节，比如融合，来使网络恢复目标更加完善。U-net网络如下所示：
这里写图片描述

第二类网络使用dilated/atrous卷积，并且去掉了池化层。

这里写图片描述
条件随机场（CRF）后处理能够提高分割效果。CRF是基于底层图像强度平滑“平滑”分割的图形模型。他们的工作原理为：强度类似的像素往往被标记为同一类。CRF能够提高1-2%的成绩。

CRF illustration. (b) Unary classifiers is the segmentation input to the CRF. (c, d, e) are variants of CRF with (e) being the widely used one. source
第三部分介绍以下

1 FCN
2 SegNet
3 Dilated Convolutions
4 Deeplab(v1&v2)
5 RefineNet
6 PSPNet
7 Large Kerel Matters
8 Deeplab v3

FCN

全卷积网络对于图像分割
14 Nov 2014

主要贡献：
    1 提出了使用端到端的卷积网络来进行语义分割
    2 直接使用预训练好的分类网络进行图像分割（迁移学习）
    3 使用反卷积层进行上采样
    4 介绍跳过连接提高上采样的粗糙度

详细解释：
    关键是在分类网络中全连接层可以看做是覆盖整个输入区域的
    内核的卷积。这相当于对原始分类网络的评估，在重叠的输入上面，但是由于计算在重叠区域是共享的，所以计算效率更高。虽然这种独到的见解不是第一次提出，但它却是提高了VOC2012测试效果。

这里写图片描述

Fully connected layers as a convolution.Source.

在经过一个全卷积的预训练的网络之后，比如说VGG。由于池化操作降低了图像空间维度，特征map仍然需要需要被上采样。与简单的双线性插值不同，反卷积层可以学习插值。该层野叫上卷积（upconvolution），全卷积（full convolution），转置卷积（transpose convolution）或者分数化卷积（fractionally-strided convolution）

然而，上采样（即使反卷积层）产生粗糙的分割图，是因为在池化过程中信息的丢失。因此，快捷连接/跳转连接能够产生分别率更高的特征对应图。
评价：

这是分割图像中一个重要的贡献，当年引用率第一。

2 SegNet

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation
Submitted on 2 Nov 2015
Arxiv Link

主要贡献：

最大池化转到解码提高分割精度

详细介绍

尽管FCN网络的上卷积层和一个跳转连接能够生成粗糙的分割图。因此，更多的跳转连接被引进。然而，不是简单的复制FCN的编码特征，同时也保留最大池化时最大值位置。这使得SegNet需要更多内存但也比FCN更加有效。

这里写图片描述
Segnet Architecture. Source.
评价：
1 FCN和SegNet都是第一次提出编码解码的结构
2 SegNet基准不够好
3 扩张卷积

Multi-Scale Context Aggregation by Dilated Convolutions
Submitted on 23 Nov 2015
Arxiv Link

主要贡献：

1 使用扩张卷积，一个卷基层用于密度估计
2 提出“上下文模块”采用扩张卷积在多尺度聚合
详细介绍
池化能帮助网络分类网络提高接受野。但是由于池化降低了分辨率，所以池化在分割方面很不好。因此，作者使用扩张卷积。如下图所示：
这里写图片描述
Dilated/Atrous Convolutions. Source
扩张卷积层（Atrous Convolutions）在不降低视觉空间的前提下增加视野维度。

在预训练网络VGG中，最后两个池化层被移除，接下来卷基层由扩张卷积替换。
特别的，在pool-3和pool-4之间的卷积层是dilation-2，pool-4之后是dilation 4。使用这个（论文中叫前端模块），在不增加参数的情况下提高了
一个模块（称为文章上下文模块）进行训练，分别与前端模块的输出作为输入。这个模块是一个级联的卷积，扩张扩张不同的多尺度上下文聚合和预测从前端的改进。
一个模块（在论文中称上下文模块）单独进行训练，与前端模块的输出作为输入。这个模块是级联的扩张卷积，拥有不同的扩张尺度，因此多尺度语境信息能被聚合，从前端的预测就被改进。

评价：
需要注意的是，分割结果的尺寸是图像尺寸的1/8。几乎所有的方法都是这样的，对它们进行插值得到最终的分割图。

（4） DeepLab（v1 & v2）

v1 : Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs
Submitted on 22 Dec 2014
Arxiv Link

v2 : DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs
Submitted on 2 Jun 2016
Arxiv Link

主要贡献：
1 使用 atrous/dilated 卷积
2 提出atrous 空间金字塔池化（ASPP）
3 使用全连接CRF

详细介绍：

atrous/dilated卷积在没有增加参数的情况下增加了视野范围。网络经过改变，如论文所示
多尺度处理可以多个调整尺寸的原图像平行通过CNN分支（金字塔图形）或者使用具有不同采样率的（ASPP）多个平行的不同的atrous 卷积层。
通过全连接CRF来实现结构预测。CRF。CRF作为后序流程单独训练/微调。
这里写图片描述
DeepLab2 Pipeline. Source.

（5） RefineNet
RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation
Submitted on 20 Nov 2016
Arxiv Link

主要贡献：

（1）具有良好解码块的编码-解码架构
（2） 所有部件遵循剩余全连接

详细解释：

采用dilated/atrous卷积也存在缺点。dilated卷积计算量大需要较大内存。因为他们已经被应用到大量高分辨率特征map。这阻碍了高分辨预测的计算。DeepLab预测，是原始输入大小的1/8。
因此，本文提出编解码的架构。编码部分是ResNet-101模块。解码器有RefineNet模块，它连接/融合编码器的高分辨率特征和以前RefineNet模块的低分辨率特征。

这里写图片描述
RefineNet Architecture. Source.
每个RefineNet模块拥有融合多分辨率特征的结构，他通过上采样低分辨率特征和捕获语境的组件，该组件基于重复size为5*5，stride为1 的重复池化层。这些组件中每个都采用了符合身份地图思维（identity map mindset）的残差连接（ResNet）
这里写图片描述
RefineNet Block. Source.
（5） PSPNet
Pyramid Scene Parsing Network
Submitted on 4 Dec 2016
Arxiv Link

主要贡献：
1 提出金字塔池化模型来聚合上下文信息
2 使用辅助损失

详细介绍：

全局场景分类重要是因为它提供了切分类别分布的线索。金字塔池化模型通过使用大规模的kernel池化层来捕捉这类信息。

Dilted 卷积在dilted卷积论文中被用来修改残差网络（Resnet），在其上面增加一个金字塔池化模型。该模型将ResNet的特征映射与上采样的输出，该输出是并行池化层，拥有能够覆盖整个，一半和一小部分图像的kernel。
辅助损失，对主要分支额外的，被应用第四阶段的ResNet（即输入金字塔池化模块）。该方法也被其他地方称为中间监督。
这里写图片描述
PSPNet. Source

(6) Large Kernel MAtters

Large Kernel Matters – Improve Semantic Segmentation by Global Convolutional Network
Submitted on 8 Mar 2017
Arxiv Link

主要贡献：
提出了拥有大面积的kernel的编解码架构

详细解释：
语义分割需要对对象进行分割和分类。由于全连接层是不可分割的结构，所以我们用非常大的卷积核来代替。
另一个原因是虽然更深度的神经网络比如ResNet拥有更大的接受视野。研究表明网络往往从一个很小的区域收集信息（有效接受域）。
较大的内核在计算上花费很大，并且参数更多。因此，K*K卷积核与1*K+K*1卷积核或者k*1+1*K卷积核近似。该模型在论文中被称作全局卷积网络（GCN）。
在架构中，ResNet（没有任何dilated卷积）组成编码部分，而GCNs和反卷积构成解码部分。一个简单的残余块被称为边界细化（BR）也被使用。
这里写图片描述
GCN Architecture.Source

(7) DeepLab v3

Rethinking Atrous Convolution for Semantic Image Segmentation
Submitted on 17 Jun 2017
Arxiv Link

主要贡献：
1 改进多孔（atrous）空间金字塔池化
2 提出使用多孔卷积级联的模型

详细解释：
ResNet模型通过使用多孔/扩张卷积被改进作为DeepLabv2和扩张卷积。改进的ASPP涉及图像层次特征的级联。一个1*1卷积和3个3*3多孔卷积以不同的比率。在每个并行卷积层后面是批处理标准化。
级联模块是一个残差网络模块，除了卷基层是不同比率的多孔。该模型类似于扩张卷积论文中的语境模块，但它直接用与中间特征映射而不是信念映射（信念映射是指与拥有与类别数目相同通道的卷基层的特征映射）
两个模型都是独立评估的。结合两者不能提高性能。他们两者都表现的非常相似在验证集上在拥有ASPP表现的更好，CRF没有使用。
这些模型都由于从DeepLabv2的最好模型。作者注意到改进来自批处理和更好的编码多尺度上下文。
这里写图片描述
DeepLabv3 ASPP（used for submission）.Source

深度学习-语义分割总结

u013580397
2017-11-11 20:19:50
5346

翻译自qure.ai 什么是语义分割对图片的每个像素都做分类。较为重要的语义分割数据集有：VOC2012 以及 MSCOCO 。有哪几种方法传统机器学习方法：如像素级的决策树分类，参考TextonF...

语义分割--(FRRN)Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes

FRRN Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes 收录：CVPR2017(IEEE...

u011974639
2018-03-14 22:15:56
483

图像语义分割之FCN和CRF

u012759136
2016-09-04 21:17:05
40055

前言(呕血制作啊！)前几天刚好做了个图像语义分割的汇报，把最近看的论文和一些想法讲了一下。所以今天就把它总结成文章啦，方便大家一起讨论讨论。本文只是展示了一些比较经典和自己觉得比较不错的结构，毕竟这方...

语义分割深度学习方法集锦

xiamentingtao
2018-01-19 16:49:27
1748

转载：https://github.com/handong1587/handong1587.github.io/edit/master/_posts/deep_learning/2015-10-09-...

语义分割相关总结

qq_21275321
2017-08-16 14:36:37
1510

好吧，实习期间学到的东西超多的，还看了一些语义分割相关的内容，嘿嘿~综述：语义分割简单来说就是像素级别的分类问题，以往我们做的分类问题只能分出一张单个图片物体的类别，然而当这个图片中有多个物体的时候它...

【Keras】基于SegNet和U-Net的遥感图像语义分割

from:【Keras】基于SegNet和U-Net的遥感图像语义分割上两个月参加了个比赛，做的是对遥感高清图像做语义分割，美其名曰“天空之眼”。这两周数据挖掘课期末project我们组选的课...

Real_Myth
2018-03-03 19:51:49
824

30篇关于语义分割的paper

2017年12月28日 17:10
103.65MB
下载

语义分割与实例分割的区别

lanyuxuan100
2017-04-26 14:37:00
5150

目前的分割任务主要有两种：（1）像素级别的语义分割（2）实例分割这个有意思，什么叫实例分割呢？它与语义分割有什么区别与联系呢？顾名思义，像素级别的语义分割，对图像中的每个像素都划分出对应的...

语义分割paper02

u010859498
2018-01-06 10:39:21
140

转自： http://blog.csdn.net/fabulousli/article/details/78633531 在FCN网络在2104年提出后，越来越多的关于图像分割的深度学习网络...

语义分割 - Semantic Segmentation Papers

Semantic Segmentation A Multi-Layer Approach to Superpixel-based Higher-order Conditional Random F...

oJiMoDeYe12345
2017-05-23 14:54:16
12181

语义分割SegNet

wmy199216
2017-05-07 18:12:10
2424

基于keras+tensorflow 直接上代码 import numpy as np from keras.models import Sequential from keras.layers im...

语义分割经典神经网络框架汇总

tianrolin
2018-02-26 19:53:37
255

语义分割经典神经网络框架汇总 FCN Jonathan Long, Evan Shelhamer, Trevor Darrell. 2014. Fully Convolutional...

深度学习之语义分割-SegNet

whz1861
2018-01-21 09:25:40
229

This core trainable segmentation engine consists of an encoder network, a corresponding decoder netw...

CV | Semantic Co-segmentation in Videos 视频协同语义分割

前言：这篇文章发表在ECCV2016上，之前读过同一作者的CVPR2016的Object Flow，最近因为做了报告，就顺便整理学习笔记了，欢迎大家一起讨论。视频的协同语义分割这个方向...

iLOVEJohnny
2017-01-05 19:12:40
2117

实例分割和语义分割的区别

zhaoshuling1109
2017-10-07 16:51:55
953

目前的分割任务主要有两种：（1）像素级别的语义分割（2）实例分割

语义分割与实力分割的区别

weixin_40294256
2018-03-18 18:56:10
67

语义分割：对图像中的每个像素都要划分出对应的类别，即实现像素级别的分类；而类的具体对象、即为实例，实例分割：不仅要进行像素级别的分类，还要在具体类别的基础上区分开不同的实例。比如说一幅图中有perso...

Semantic Segmentation 语义分割 -- 深度学习（一）

一 . Semantic Segmentation 定义和特点作为传统的计算机视觉领域的经典问题，Semantic Segmentation 语义分割是分割问题研究的热门问题。具...

JYZhang_CVML
2017-01-31 16:25:21
5475

深度卷积网络CNN与图像语义分割

xiahouzuoxin
2015-08-19 22:33:05
77677

转载请注明出处: http://xiahouzuoxin.github.io/notes/级别1：DL快速上手级别2：从Caffe着手实践级别3：读paper，网络Train起来级别3：Demo跑起来...

计算机视觉 - 语义分割（semantic segmentation）

转载自：http://blog.geohey.com/ji-suan-ji-shi-jue-zhi-yu-yi-fen-ge/计算机视觉之语义分割2017年10月11日人工智能被认为是第四次工业革命，...

sinat_35496345
2018-03-19 11:39:43
112

论文笔记 |　基于深度学习的图像语义分割技术概述之5.1度量标准

本文为论文阅读笔记，不当之处，敬请指正。 A Review on Deep Learning Techniques Applied to Semantic Segmentation:原文链接 ...

u014593748
2017-05-12 12:20:20
4015

图像语义分割

zhangsh_20930
2017-09-15 23:55:07
717

分割

图像语义分割学习笔记～心得

u011771047
2017-05-20 11:23:42
1485

图像语义分割学习过程中的笔记，心得

FCN/MRF图像语义分割与马克尔夫随机场

u011534057
2016-09-26 14:15:24
2920

参考自知乎作者：困兽链接：https://zhuanlan.zhihu.com/p/22308032 前言 (呕血制作啊！)前几天刚好做了个图像语义分割的汇报，把最近看的论文和一些想法讲了一下。...

语义分割(semantic segmentation) 常用神经网络介绍对比-FCN SegNet U-net DeconvNet

在读U-Net的时候，感觉文章有点难以理解，所以就来找有没有大神写的说明性文章，看到这篇感觉很厉害，转过来了原文http://blog.csdn.net/u012931582/article/deta...

Miss_yan
2018-03-03 20:52:39
61

语义分割文献集合

u011489887
2018-02-27 18:18:11
117

语义分割 Global Deconvolutional Networks BMVC 2016 https://github.com/DrSleep/GDN半监督语义分割 Mix-and-Matc...

图像分类，物体检测，语义分割，实例分割的联系和区别

图像理解包含图像分类、物体检测、物体分割、实例分割等若干具体问题。每个问题研究范畴是什么？或者每个问题中图像的处理结果是什么？整理如下。...

niaolianjiulin
2016-10-27 18:07:00
2893

深度学习（三十三）CRF as RNN语义分割-未完待续

hjimce
2016-03-14 19:07:38
21062

文献最大的意义在于把CRF的求解推理迭代过程看成了RNN的相关运算，嵌入CNN模型中，达到了真正的算法之间的融合。想要深入理解这篇文献，需要先学会文献《Efficient Inference in F...

（译）从全卷积网络到大型卷积核：深度学习的语义分割全指南

图像语义分割深度学习算法发展

aitazhixin
2017-11-16 17:24:10
895

基于深度学习的图像语义分割技术概述之常用方法

gqixf
2017-09-19 15:05:01
1865

深度学习图像分割的常用方法深度学习在多种高级计算机视觉任务中的成功—特别是监督CNNs（Convolutional Neural Networks，卷积神经网络）在图像分类、物体检测方面的成功...

实时语义分割--ICNet for Real-Time Semantic Segmentation on High-Resolution Images

ICNet语义分割算法

hutanglove

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

语义分割总结

深度学习-语义分割总结

语义分割--(FRRN)Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes

图像语义分割之FCN和CRF

语义分割深度学习方法集锦

语义分割相关总结

【Keras】基于SegNet和U-Net的遥感图像语义分割

30篇关于语义分割的paper

语义分割与实例分割的区别

语义分割paper02

语义分割 - Semantic Segmentation Papers

语义分割SegNet

语义分割经典神经网络框架汇总

深度学习之语义分割-SegNet

CV | Semantic Co-segmentation in Videos 视频协同语义分割

实例分割和语义分割的区别

语义分割与实力分割的区别

Semantic Segmentation 语义分割 -- 深度学习（一）

深度卷积网络CNN与图像语义分割

计算机视觉 - 语义分割 （semantic segmentation）

论文笔记 | 基于深度学习的图像语义分割技术概述之5.1度量标准

图像语义分割

图像语义分割学习笔记～心得

FCN/MRF图像语义分割与马克尔夫随机场

语义分割(semantic segmentation) 常用神经网络介绍对比-FCN SegNet U-net DeconvNet

语义分割文献集合

图像分类，物体检测，语义分割，实例分割的联系和区别

深度学习（三十三）CRF as RNN语义分割-未完待续

（译）从全卷积网络到大型卷积核：深度学习的语义分割全指南

基于深度学习的图像语义分割技术概述之常用方法

实时语义分割--ICNet for Real-Time Semantic Segmentation on High-Resolution Images

计算机视觉 - 语义分割（semantic segmentation）

论文笔记 |　基于深度学习的图像语义分割技术概述之5.1度量标准