【OpenMMLab 2023 Course】Lecture 6

语义分割是将图像按物体类别分割,等同于像素分类。常用方法包括FCN、U-Net和DeepLab系列,它们通过全卷积、特征融合和空洞卷积捕获上下文信息。评估标准涉及mAcc、mIoU和mDice。MMSegmentation是一个语义分割的研究平台,集成多种最新方法。
摘要由CSDN通过智能技术生成

语义分割任务介绍

  • 将图像按照物体的类别分割成不同的区域
    • 等价于对每个像素进行分类

子任务

  • 语义分割:仅考虑像素的类别,不分割同一类的不同实体
  • 实例分割:分割不同的实体,仅考虑前景物体
  • 全景分割:背景仅考虑类别,前景需要区分实体

基本思路

按颜色分割

  • 物体内部颜色相近,物体交界颜色变化
  • 问题:不同物体颜色可能相近,物体内也会包含多种颜色

逐像素分类

  • 可以充分利用已有的图像分类模型
  • 问题:效率低下,重叠区域重复计算卷积

全卷积网络FCN

  • FC层卷积化
  • 对预测的分割图升采样,恢复原图分辨率
    • 双线性插值(可由卷积实现)
    • 转置卷积:可学习的升采样层
  • 高层特征经过多次降采样,细节丢失严重
    • 需结合低层次和高层次特征图,分别产生类别预测,升采样到原图大小,再平均得到最终结果

U-Net

  • 逐级融合高低层次特征

上下文信息

  • 即图像周围的内容
  • 增加感受野更大的网络分支,将上下文信息导入局部预测中

PSPNet

  • 对特征图进行不同尺度的池化,得到不同尺度的上下文特征
  • 上下文特征经过通道压缩和空间上采样之后拼接回原特征图,同时包含局部和上下文特征
  • 基于融合的特征产生预测图

DeepLab

  • 提出空洞卷积
    • 将池化层和卷积中的步长去掉,可以减少下采样的次数,特征图就会变大,需要对应增大卷积核,以维持相同的感受野,但会增加大量参数
    • 使用空洞卷积(Dilated Convolution/Atrous Convolution),在不增加参数的情况下增大感受野
  • 去除分类模型中的后半部分的下采样层
  • 后续的卷积层改为不同尺度的膨胀卷积,并且逐步增加rate来维持原网络的感受野
  • DeepLab v3+ 将“空间金字塔池化捕捉上下文特征”和“Encoder-Decoder结构”两种思路融合

评估指标

  • mAcc、mIoU、mDice

MMSegmentation

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值