【论文阅读】semantic image segmentation with deep convolutional nets and fully connected CRFs

本文详细介绍了DeepLab模型在语义图像分割领域的应用,通过结合深度卷积神经网络(DCNN)和全连接条件随机场(CRF)来提升分割精度。文章指出,使用空洞卷积算法解决了信号下采样的问题,同时通过CRF进行后处理,捕捉精细边缘。在PASCAL VOC 2012挑战赛中,DeepLab模型取得了优异的性能,平均IOU达到71.6%。
摘要由CSDN通过智能技术生成

文章的主要贡献:

  • 速度:带atrous算法的DCNN可以保持8FPS的速度,全连接CRF平均推断需要0.5s;
  • 准确:在PASCAL语义分割挑战中获得了第二的成绩;
  • 简单:DeepLab是由两个非常成熟的模块(DCNN和CRFs)级联而成。

一、概述

自LeCun(1998)以来,DCNN一直被选作版面识别的方法,如今已经成为高级视觉研究的主流,提高了计算机视觉性能,广泛应用于图像分割,对象检测,细粒度分类等。相比于传统的视觉算法(SIFT或HOG),DCNN以其end-to-end(端到端)方式获得了很好的效果。这个依赖于DCNN对图像转换的平移不变性,根本是源于重复的池化层和下采样组合。平移不变性增强了对数据分层抽象的能力,但同时可能会阻碍低级视觉任务,例如姿态估计、语义分割等,在这些任务中语义分割更倾向于精确的定位而不是抽象的空间关系。

由此文章提出了DCNN的两个障碍:(1)信号下采样;(2)空间不敏感性。

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值