08 语义分割与MMSegmentation

记录时间:2023年6月13日

应用

  1. 医疗领域
    在这里插入图片描述
  2. 遥感领域
    在这里插入图片描述
  3. 钢轨表面裂纹提取
    在这里插入图片描述
  4. 无人驾驶
    在这里插入图片描述
  5. 人像分割
    在这里插入图片描述

比较

在这里插入图片描述

经典论文

Fully Convolutional Network

论文:Fully convolutional networks for semantic segmentation (CVPR 2015)
在这里插入图片描述

解决问题1:图像分类模型使用降采样层(步长卷积或池化)获得高层次特征,导致全卷积网络输出尺寸小于原图,而分割要求同尺寸输出。

思路:使用升采样,升采样的方法:

  1. 双线性插值
  2. 转置卷积
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    解决问题2:基于顶层特征预测,再升采样32倍得到的预测图较为粗糙。
    解决思路:结合高层次与低层次特征,如FCN,如U-net(下篇论文)
    在这里插入图片描述
    在这里插入图片描述

UNet

解决方法:逐级融合高层次与低层次特征
论文:U-Net: Convolutional Networks for Biomedical Image Segmentation (MICCAI 2015)
在这里插入图片描述

PSPNet

解决问题:更好的获取上下文的信息
在这里插入图片描述

DeepLab系列

v3+的版本目前使用最多,DeepLab v3+是经典的模型
在这里插入图片描述
在这里插入图片描述

解决问题1:网络中的下采样问题
解决方法:空洞卷积
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

解决问题2:模型直接输出的分割图较为粗糙,尤其再物体边界处不能产生很好的分割效果。
解决方法:条件随机场,Conditional Random Field, CRF
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

解决问题3:上下文信息
解决方法:(多尺度空洞卷积)ASPP模块捕捉上下文信息
在这里插入图片描述

语义分割算法演进

问题:

  1. 网络的降采样问题
  2. 恢复预测图细节的问题
  3. 上下文信息的处理问题
    在这里插入图片描述

前沿新算法

SegFormer

发展趋势:使用Transformer
论文:SegFormer:Simple and Efficient Design for Semantic Segmentation with Transformers
在这里插入图片描述

K-Net

发展趋势:统一语义分割、实例分割和全景分割任务
论文:K-Net:Towards Unified Image Segmentation
在这里插入图片描述

MaskFormer

论文:Per-Pixel:Classification is not all you need for semantic segmentation
在这里插入图片描述

Mask2Former

论文:Masked-attention Mask Transformer for Universal Image Segmentation
在这里插入图片描述

Segment Anything(SAM)

Facebook提出的。
发展趋势:视觉大模型

评估方法

  1. IoU
  2. Dice
  3. Accuracy
  4. mAcc
  5. mIoU
  6. mDice
    在这里插入图片描述
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值