场景解析和语义分割区别_深度学习-语义分割总结

最新推荐文章于 2023-12-27 17:59:16 发布

想吃苦了

最新推荐文章于 2023-12-27 17:59:16 发布

阅读量340

点赞数

文章标签：场景解析和语义分割区别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42527160/article/details/113014056

版权

什么是语义分割

对图片的每个像素都做分类。

较为重要的语义分割数据集有：VOC2012 以及 MSCOCO 。

有哪几种方法

传统机器学习方法：如像素级的决策树分类，参考TextonForest 以及 Random Forest based classifiers 。再有就是深度学习方法。更确切地说，是卷积神经网络。

深度学习最初流行的分割方法是，打补丁式的分类方法 ( patch classification ) 。逐像素地抽取周围像素对中心像素进行分类。由于当时的卷积网络末端都使用全连接层 ( full connected layers ) ，所以只能使用这种逐像素的分割方法。

2014年，来自伯克利的 Fully Convolutional Networks(FCN) 卷积网络，去掉了末端的全连接层。随后的语义分割模型基本上都采用了这种结构。除了全连接层，语义分割另一个重要的问题是池化层。池化层能进一步提取抽象特征增加感受域，但是丢弃了像素的位置信息。但是语义分割需要类别标签和原图像对齐，因此需要从新引入像素的位置信息。有两种不同的架构可以解决此像素定位问题。

第一种是编码-译码架构。编码过程通过池化层逐渐减少位置信息、抽取抽象特征；译码过程逐渐恢复位置信息。一般译码与编码间有直接的连接。该类架构中U-net 是最流行的。

第二种架构是膨胀卷积 ( dilated convolutions ) ，抛弃了池化层。使用的卷积核如下图。

条件随机场的后处理经常用来提高分割的精确度。后处理利用图像的光感强度(可理解为亮度)，将周围强度相近的像素分为同一类。能提高 1-2 个百分点。

文章汇总

FCN 2014年

主要的贡献：

为语义分割引入了端到端的全卷积网络，并流行开来

重新利用 ImageNet 的预训练网络用于语义分割

使用反卷积层进行上采样

引入跳跃连接来改善上采样粗糙的像素定位

说明：

比较重要的发现是，分类网络中的全连接层可以看作对输入的全域卷积操作，这种转换能使计算更为高效࿰

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
场景解析和语义分割区别_深度学习-语义分割总结

什么是语义分割对图片的每个像素都做分类。较为重要的语义分割数据集有：VOC2012以及MSCOCO。有哪几种方法传统机器学习方法：如像素级的决策树分类，参考TextonForest以及Random Forest based classifiers。再有就是深度学习方法。更确切地说，是卷积神经网络。深度学习最初流行的分割方法是，打补丁式的分类方法 ( patch classificati...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。