语义分割发展史

在深度学习应用到计算机视觉领域之前,研究人员一般使用纹理基元森林(TextonForest)或是随机森林(Random Forest)方法来构建用于语义分割的分类器。

卷积神经网络(CNN)不仅能很好地实现图像分类,而且在分割问题中也取得了很大的进展。

最初,图像块分类是常用的深度学习方法,即利用每个像素周围的图像块分别将各像素分成对应的类别。其中,使用图像块的主要原因是分类网络通常具有全连接层,其输入需为固定大小的图像块。

2014年,加州大学伯克利分校的Long等人提出的完全卷积网络(Fully Convolutional Networks),推广了原有的CNN结构,在不带有全连接层的情况下能进行密集预测。
后面对FCN主要做了 上采样(Upsample)(如SegNet/DeconvNet) 跳跃结构(Skip Layer)(如DeepLab)的改进
此处的上采样即是反卷积(Deconvolution)。当然关于这个名字不同框架不同,Caffe和Kera里叫Deconvolution,而tensorflow里叫conv_transpose。
跳跃结构(Skip Layer)这个结构的作用就在于优化结果,因为如果将全卷积之后的结果直接上采样得到的结果是很粗糙的,所以作者将不同池化层的结果进行上采样之后来优化输出。

这种结构的提出使得分割图谱可以生成任意大小的图像,且与图像块分类方法相比,也提高了处理速度。在后来,几乎所有关于语义分割的最新研究都采用了这种结构。

除了全连接层结构,在分割问题中很难使用CNN网络的另一个问题是存在池化层。池化层不仅能增大上层卷积核的感受野,而且能聚合背景同时丢弃部分位置信息。然而,语义分割方法需对类别图谱进行精确调整,因此需保留池化层中所舍弃的位置信息。

研究者提出了两个不同形式的结构来解决这个问题。

第一种方法是编码器-解码器(encoder-decoder)结构。其中,编码器使用池化层逐渐缩减输入数据的空间维度,而解码器通过反卷积层等网络层逐步恢复目标的细节和相应的空间维度。从编码器到解码器之间,通常存在直接的信息连接,来帮助解码器更好地恢复目标细节。在这种方法中,一种典型结构为U-Net网络。
第二种方法使用了称作空洞卷积的结构,且去除了池化层结构。

条件随机场(Conditional Random Field,CRF)方法通常在后期处理中用于改进分割效果。CRF方法是一种基于底层图像像素强度进行“平滑”分割的图模型,在运行时会将像素强度相似的点标记为同一类别。加入条件随机场方法可以提高1~2%的最终评分值。
一个通用的框架已经大概确定了。即:
这里写图片描述
前端使用FCN进行特征粗提取,后端使用CRF/MRF优化前端的输出,最后得到分割图。
最开始使用DenseCRF(全连接条件随机场)是直接加在FCN的输出后面,可想这样是比较粗糙的。而且在深度学习中,我们都追求end-to-end的系统,所以CRFasRNN这篇文章将DenseCRF真正结合进了FCN中。

http://www.sohu.com/a/155907339_610300
https://zhuanlan.zhihu.com/p/22308032

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
高精度语义分割是计算机视觉领域的一个重要研究方向,近年来得到了广泛的关注和研究。以下是高精度语义分割方法的发展史: 1.传统方法:传统的语义分割方法主要基于图像分割技术,如基于区域的分割方法和基于边缘的分割方法。这些方法的主要问题是需要手动选择特征和参数,且对于复杂场景的分割效果不佳。 2.基于深度学习的方法:随着深度学习技术的发展,基于深度学习的语义分割方法逐渐成为主流。最早的方法是基于全卷积网络(FCN)的方法,该方法将全连接层替换为卷积层,可以对任意大小的输入图像进行像素级别的分类。后来,出现了一系列基于FCN的改进方法,如U-Net、SegNet、DeepLab等。 3.多尺度方法:为了解决语义分割中物体尺度变化的问题,出现了一系列基于多尺度的方法,如PSPNet、DeepLabv3+等。这些方法通过对输入图像进行不同尺度的处理,从而提高了分割的准确率。 4.注意力机制方法:注意力机制是一种可以自适应地对不同区域进行加权的方法,可以用于提高语义分割的准确率。基于注意力机制的方法包括DANet、OCRNet等。 5.级联方法:级联方法是一种将多个分割模型级联起来的方法,可以提高分割的准确率。基于级联的方法包括RefineNet、DenseASPP等。 以上是高精度语义分割方法的发展史,随着深度学习技术的不断发展,相信未来还会出现更加先进的方法来解决语义分割中的各种问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值