SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS

该博客探讨了深度卷积神经网络(DCNNs)在语义图像分割任务中的局限性,并提出结合全连接条件随机场(CRFs)来提升定位精度。通过使用空洞算法和深度卷积网络,DeepLab系统在PASCAL VOC2012语义图像分割任务中达到了71.6%的IOU,实现了速度、精度和简单性的平衡。
摘要由CSDN通过智能技术生成

使用深度卷积网络和全连接的CRFs进行语义图像的分割

CRF-条件随机场  Liang-Chieh Chen 加州大学洛杉矶分校

摘要

深度卷积神经网络(DCNNs)最近已经在高水平的视觉任务中展示出了最先进的表现,例如图像分类和目标检测。这项工作汇集了来自DCNNs和概率图模型的方法,为了解决像素级分类的任务(也叫作语义级图像分割)。我们展示了深度卷积网络(DCNNs)的最后一层不足够能定位为了精确的物体的分割。这是由于不变的属性使得深度卷积网络(DCNNs)对高水平的任务更好。我们克服了这种深度网络的不良定位的属性,通过结合了DCNN最后一层的反应和一个全连接的条件随机场。定性地说,我们的DeepLab系统能够以超出以往精度方法的水平去定位分段的边界。定量地说,我们的方法在PASCAL VOC2012语义图像分割任务中设定了一个新的先进的技术,使得在测试集上的精度达到了71.6%IOU。我们展示了这些结果如何能被有效的获得:网络再利用和一个来自小波团体的空洞算法的新颖的应用,可以在一个现代的GPU上以每秒8帧的的响应做稠密的计算。

1 简介

自从LeCun等人以来,深度卷积神经网络(DCNNs)已经成为文档识别的首选,但最近才成为高级视觉的主流研究。在过去的两年里,DCNNs将计算机视觉系统的性能推向了各种高级问题的飙升,包括图像分类、物体检测、细粒度分类等等。在这些作品中一个常见的主题是,DCNNs训练了一种端到端的方式结果要显著地好于使用仔细策划的表示,如SIFT或者HOG特征等。  这种成功能被部分归因于建立了DCNNs定位图像变换的不变性,这也巩固了其学习阶级性提取数据的能力。然而这种不变性对于高级别的视觉任务是理想的,但他却妨碍了低级别的任务,如姿态估计和语义分割,我们想要去精准定位

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值