语义分割总结

最新推荐文章于 2024-07-26 15:57:18 发布

niuniu924

最新推荐文章于 2024-07-26 15:57:18 发布

阅读量1.4k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niuniu924/article/details/91361250

版权

语义分割：像素级的分类任务
方法：传统机器学习 -> 深度学习

传统机器学习：

Grab-cut

缺点：

二类分割
人工干预

深度学习：

深度学习最初流行的分割方法是，打补丁式的分类方法 (patch classification) 。逐像素地抽取周围像素对中心像素进行分类。由于当时的卷积网络末端都使用全连接层 (full connected layers) ，所以只能使用这种逐像素的分割方法。

FCN: Fully Convolutional Networks for Semantic Segmentation

https://arxiv.org/pdf/1411.4038.pdf

主要的贡献：

为语义分割引入了端到端的全卷积网络，并流行开来
重新利用 ImageNet 的预训练网络用于语义分割
使用反卷积层进行上采样
引入跳跃连接来改善上采样粗糙的像素定位

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

https://arxiv.org/pdf/1511.00561.pdf

编码-译码架构

主要贡献：将池化层结果应用到译码过程。引入了更多的编码信息。使用的是pooling indices而不是直接复制特征，只是将编码过程中 pool 的位置记下来，在 upsamping 时使用该信息。

U-Net: Convolutional Networks for Biomedical Image Segmentation

https://arxiv.org/pdf/1505.04597.pdf

U-Net有更规整的网络结构，通过将编码器的每层结果拼接到译码器中得到更好的结果。

Dilated Convolutions: Multi-Scale Context Aggregation by Dilated Convolutions

https://arxiv.org/pdf/1511.07122.pdf

避免了使用池化操作的同时增大了感受野，不需要图像分辨率的压缩，保留了图像内部的数据结构，可以有比标准卷积更好的分割效果。

DeepLab v1 & DeepLab v2

https://arxiv.org/pdf/1412.7062v3.pdf

https://arxiv.org/pdf/1606.00915.pdf

FCN + ASPP + Fully CRF

ASPP

RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation

https://arxiv.org/pdf/1611.06612.pdf

主要贡献：

精心设计的译码模块
所有模块遵循残差连接设计

PSPNet: Pyramid Scene Parsing Network

https://arxiv.org/pdf/1612.01105.pdf

主要贡献：

提出了金字塔池化模块来聚合图片信息
使用附加的损失函数

金字塔池化模块通过应用大核心池化层来提高感知域。使用膨胀卷积来修改ResNet网，并增加了金字塔池化模块。金字塔池化模块对ResNet输出的特征进行不同规模的池化操作，并作上采样后，拼接起来，最后得到结果。

Large Kernel Matters: Improve Semantic Segmentation by Global Convolutional Network

https://arxiv.org/pdf/1703.02719.pdf

主要贡献：

提出了使用大卷积核的编码-译码架构

理论上更深的ResNet能有很大的感知域，但研究表明实际上提取的信息来自很小的范围，因此使用大核来扩大感知域。但是核越大，计算量越大，因此将k x k的卷积近似转换为1 x k + k x 1和k x 1 + 1 x k卷积的和，称为GCN。

本文的架构是：使用ResNet作为编译器，而GCN和反卷积作为译码器。还使用了名为Boundary Refinement的残差模块。

DeepLab v3: Rethinking Atrous Convolution for Semantic Image Segmentation

https://arxiv.org/pdf/1706.05587.pdf

主要贡献：

改进 ASPP
串行部署 ASPP 的模块

DeepLab v3+: Encoder-Decoder with Atrous SeparableConvolution for Semantic Image Segmentation

https://arxiv.org/pdf/1802.02611.pdf

主要贡献：

论文提出了一个全新的encoder-decoder架构，使用DeepLabv3作为encoder模块，并添加了一个简单却有效的decoder模块
提出的encoder-decoder架构中，可通过扩张卷积直接控制提取encoder特征的分辨率，用于平衡精度和运行时间
论文将Xception结构应用于分割任务中，在ASPP和decoder模块中加入深度分离卷积，获得到强大又快速的模型

关于Xception:

https://www.jianshu.com/p/4708a09c4352

DenseASPP: DenseASPP for Semantic Segmentation in Street Scenes

http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_DenseASPP_for_Semantic_CVPR_2018_paper.pdf

Deep Layer Aggregation:

https://arxiv.org/pdf/1707.06484.pdf

A Review on Deep Learning TechniquesApplied to Semantic Segmentation

https://arxiv.org/pdf/1704.06857.pdf

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄7年

19
原创

16
点赞

84
收藏

9
粉丝

关注

私信

热门文章

分类专栏

前端 5篇
javascript 1篇
开发 2篇
机器学习 1篇
计算机网络技术基础 2篇
SLAM 7篇
深度学习 2篇
C++ 1篇

最新评论

Deeplabv3+安装并运行自己的数据集
诸葛非常的亮回复 niuniu924: 学利率改为多少呢？
Deeplabv3+安装并运行自己的数据集
居居葵: 博主您好，我运行eval和vis都遇见了报错：W tensorflow/core/framework/op_kernel.cc:1502] OP_REQUIRES failed at spacetobatch_op.cc:219 : Invalid argument: padded_shape[0]=233 is not divisible by block_shape[0]=2；请问这是什么问题？感谢您的回答！
Deeplabv3+安装并运行自己的数据集
qq_41607902: 博主，打扰了，就是我设置了max_number_of_evaluations=1 ，运行eval.py的时候还是显示：INFO:tensorflow:Waiting for new checkpoint at ./train_save/model.ckpt，还有其他办法可以解决吗？
Deeplabv3+安装并运行自己的数据集
weixin_45891483: 博主您好，输出miou是把那9行代码都加到eval.py的第155行嘛？我到您分享的源代码链接里找到第154行，是在这两行代码下面加入吗？我没能找到准确位置 for eval_scale in FLAGS.eval_scales: predictions_tag += '_' + str(eval_scale) [/code]
Deeplabv3+安装并运行自己的数据集
niuniu924 回复 Whiteleaf3er: 就是要设置=1，它会找最新的模型评价，否则它会一直循环等待训练出新模型评价，这样你就看不到miou了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。