Semantic Segmentation --DeepLab(1,2,3)系列总结

DeepLab系列总结

截图内容源于官方的PPT

关于DeepLabv1,DeepLabv2,DeepLabv3汇总:

DeepLab系列针对的Task

DeepLab是针对语义分割(Semantic Segmentation)任务提出的深度学习系统:

这里写图片描述

语义分割的要求:

  • 语义分割是对图像做密集的分割任务,分割每个像素到指定类别上
  • 将图像分割成几个有意义的目标
  • 给对象分配指定类型标签

语义分割的用途:

  • 自动驾驶
  • 医疗辅助

这里写图片描述


DeepLabv1 & DeepLabv2

  • 使用DCNN做密集的分类任务,产生的预测图有目标大概的位置,但比较粗糙
  • 使用条件随机场(CRF)细化分割结果

这里写图片描述

核心解决思路

对于标准的DCNN有哪些问题?针对这些问题,DeepLab的解决办法
1.分辨率: 输出特征分辨率较小
2.池化: 对于输入变换具有内在不变性
1.使用空洞卷积
2. 使用CRF

这里写图片描述

DCNN中使用空洞卷积

这里写图片描述
- 移除原网络最后两个池化层
- 使用 rate=2 r a t e = 2 的空洞卷积采样

如上图右下所示,标准的卷积只能获取原图1/4的内容,而新的带孔卷积可以在全图上获取信息。

DeepLabv1到DeepLabv2有一个变化:

这里写图片描述

由左边到右边,主要是在DCNN中应用了空洞卷积密集的提取特征,左边的输出步幅是16,需要上采样16倍得到预测结果,可以看到结果是比较模糊的;而右边是在DCNN中使用空洞卷积,保持步幅为8,只需要上采样8倍,结果清晰了很多。

CRF部分

DCNN存在分类和定位之间的折中问题,预测到目标的大概位置但比较模糊。

这里写图片描述

CRF尝试找到图像像素之间的关系: 相近且相似的像素大概率为同一标签;CRF考虑像素的概率分配标签;迭代细化结果。

模型结构介绍

DeepLabv1结构介绍

这里写图片描述

DeepLabv1是在VGG16的基础上做了修改:

  • VGG16的全连接层转为卷积
  • 最后的两个池化层去掉了下采样
  • 后续卷积层的卷积核改为了空洞卷积
  • 在ImageNet上预训练的VGG16权重上做finetune

可视化结果如下:

这里写图片描述

DeepLabv2结构介绍

DeepLabv2在DeepLabv1上做了改进:

这里写图片描述
- 用多尺度获得更好的分割效果(使用ASPP)
- 基础层由VGG16转为ResNet
- 使用不同的学习策略(poly)

ASPP模块
为什么要提出ASPP?解决思路实施办法
语义分割挑战:在多尺度上存储目标在给定的特征层上使用不同采样率的卷积有效的重采样使用不同采样率的空洞卷积并行采样

这里写图片描述

ASPP中在给定的Input Feature Map上以 r=(6,12,18,24) r = ( 6 , 12 , 18 , 24 ) 3×3 3 × 3 空洞卷积并行采样。

这里写图片描述
ASPP各个空洞卷积分支采样后结果最后融合到一起(通道相同,做像素加),得到最终预测结果.

DeepLabv2可视化结果:

这里写图片描述

DeepLabv1 & DeepLabv2优势

这里写图片描述

  • 速度上: 使用空洞卷积的Dense DCNN达到8fps,全连接的CRF需要0.5s
  • 精准度:在几个先进的数据集上达到了先进的结果
  • 建议性:系统由两个成熟的模块组成,DCNNs和CRFs

DeepLabv3

相比DeepLabv1 & DeepLabv2的改变

这里写图片描述

  • 提出了更通用的框架,适用于任何网络
  • 复制了ResNet最后的block,并级联起来
  • 在ASPP中使用BN层
  • 没有使用CRF

模型结构介绍

这里写图片描述

  • 复制ResNet最后一个block多个副本,级联到一起
    • 在本文中,block5-7是block4的副本
  • 每个block中包含三个卷积(使用Mutli-gird策略)
  • 最后一个block的最后一个卷积步长为2(???)
  • 为了维持原图尺寸,使用不同的采样率(每层采样率乘2)空洞卷积代替原卷积

ASPP模块

这里写图片描述

相比于DeepLabv2的ASPP模块,有以下变化和问题:

  • ASPP中应用了BN层
  • 随着采样率的增加,滤波器中有效的权重减少了(有效权重减少,难以捕获原距离信息,这要求合理控制采样率的设置)
  • 使用模型最后的特征映射的全局平均池化(为了克服远距离下有效权重减少的问题)

这里写图片描述

新的ASPP模块包括:

  • 一个 1×1 1 × 1 卷积和3个 3×3 3 × 3 的空洞卷积(采样率为(6,12,18)),每个卷积核都有256个且都有BN层
  • 包含图像级特征(即全局平均池化)

所有分支得到的结果通过 1×1 1 × 1 卷积级联到一起得到最终结果。

DeepLabv3的实验结果

在PASCAL VOC 2012测试集上,相比于DeepLabv2的77.69%,DeepLabv3有2%的提升:

这里写图片描述
最好的结果包含:

  • ASPP
  • 输出步幅为8
  • 翻转和随机缩放的数据增强

可视化结果:

这里写图片描述

  • 33
    点赞
  • 142
    收藏
    觉得还不错? 一键收藏
  • 14
    评论
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值