深度之眼--图像分割第四周Deeplab

1.语义分割面临的问题

        1.CNN可以可靠地预测图像中物体的存在和粗糙位置,但不太适合定位它们的精确轮廓。连续下采样会导致图像浅层特征损失,分类精度和定位精度与卷积网络之间存在着自然的权衡:层数越深/变换越复杂(提取抽象特征) ,分类精度越高 ,但会损失定位信息。
        2.同一张图片中不同大小物体的分割精度不同,因为不同尺度卷积核对不同大小物体的分割效果不同。在分辨率较小的情况下,小物体的位置信息经常被丢失。

2.Deeplab系列的思想

       当前的图像分割CNN是根据classification这种high-level semantics改编的,但CNN做语义分割时精准度不够,根本原因是 DCNNs 的高级特征的平移不变性,即高层次特征映射,根源于重复的池化和下采样会丢失localization信息,即无法对像素点精确定位语义(low-level semantics)。针对下采样或池化降低分辨率,DeepLab采用了空洞卷积代替池化操作来扩展感受野,获取更多的上下文信息。同时DeepLab v1v2 结合了深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)的方法。
       DeepLab v2提出了串行的ASPP模块,大大扩展了卷积核的感受野,但随着感受野越来越接近图像大小,会退化为1x1卷积。为了解决这个问题,DeepLab v3改进了ASPP空洞卷积空间金字塔池化层,不同的dilation卷积并行操作,然后归一尺寸后求和。ASPP模块借鉴PSPNet思想,通过不同采样率的空洞卷积并行采样,捕捉图像不同尺度的上下文信息。

3.简述ASPP模块

        由于被检测物体具有不同的尺度,给分割增加了难度。传统的方法是通过rescale图片,分别经过DCNN检测、融合,但由于计算量大,DeepLab就设计了一个ASPP模块,借鉴了PSP模块的思想进行多尺度特征提取,既能得到多尺度信息,计算量又比较小。
        ASPP是DeepLab中用于语义分割的一个模块,全称是空洞卷积空间金字塔池化层,原理是将特征图分别输入不同空洞率的dilati

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值