深度学习之DeepLab用于语义分割

DeepLab模型利用Atrous Convolution解决语义分割中的分辨率下降和物体尺度问题,结合ASPP和CRF提高边界定位精度。在多个数据集上表现出高精度和速度,适用于实时场景。
摘要由CSDN通过智能技术生成

摘要

  • 研究点:CNN做语义分割
  • 工程主页:http://liangchiehchen.com/projects/DeepLab.html
  • 主要贡献:

    1. atrous conv: 可以控制参与卷积的feature的分辨率
      Subsample -> Conv(kernel) 和 AtrousConv(kernel) -> Subsample 等价,且 AtrousConv(kernel) 平移不变。
      参考博客:http://blog.csdn.net/u012759136/article/details/52434826#t9

    2. atrous spatial pyramid pooling (ASPP) : 可以在不同的scale下分割物体。

    3. 定位物体边界更加精确!将 DCNN layer 最后的输出与 fully connected Conditional Random Field (CRF)结合,克服了DCNN中最大池化和下采样造成的定位精度不准的问题。
  • 关键词: 语义分割;atrous convolution; CRF

1 Introduction

DCNN在语义分割这一块的局限性:
(1) 分辨率下降(max-pooling and downsampling 的stride引起)reduced feature resolution

引用了FCN做语义分割的[14] ,并指出其缺点是空间分辨率大大降低!作者为克服该问题,去掉了池化后几层的下采样操作,而在后续的几层卷积层中加入了上采样操作。
Use atrous convolution as a shorthand for convolution with upsampled filters
atrous convolution [3,6,16]

相比采用deconv(反卷积)的方法[13,14],作者采用的atrous conv+线性插值的方法也非常有效。
其优势在于:不需要增加参

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值