深度学习图像分割概述

FCN

图像语义分割的开始。
用卷积层替代全连接层,输入图像可以是任意尺寸,且输出与输入图像相同尺寸的特征图。
pooling层增大感受野,减少尺寸;upsampling增大图像尺寸。
这里用了“跳级结构”的反卷积操作用浅层信息辅助逐步进行上采样,但是仍然存在信息损失的问题,分割结果不够精细。
改进的方法,一个是UNet,一个是空洞卷积。
首先解释一下感受野。感受野指的是一个特定的CNN特征(特征图上的某个点)在输入空间所受影响的区域。感受野的计算不考虑padding(原始图像)。计算公式为:
在这里插入图片描述

空洞卷积

在这里插入图片描述
在这里插入图片描述
空洞卷积就是在传统的卷积中加入了一个dilation rate这个系数。可以从两个方面理解这个参数,从原图像层面理解:就是我们对原图以(dilation rate-1)进行间隔采样;从卷积核自身的角度来看,我们相当于在未使用空洞卷积的卷积核中,在其内部插入(dilation rate-1)个0,可以理解为使用空洞卷积之后我们卷积核的尺寸变大了。计算公式为:
kernel_size_after_dilate = (dilate rate -1) * (kernel_size_before_dilate - 1) + kernel_size_before_dilate
存在的问题:会损失图像信息的连续性,形成栅格效应(The Gridding Effect);小物体的分割效果比较差。

HDC (Hybrid Dilated Vonvolution)

是对空洞卷积的改进。
主要是三个方面:
dilated rate不能有大于1的公约数(比如[2, 4, 6]),不然会产生栅格效应;
dilated rate设计成了锯齿状结构,例如[1, 2, 5, 1, 2, 5]这样的循环结构;
需要满足:在这里插入图片描述
一个简单的例子: dilation rate [1, 2, 5] with 3 x 3 kernel (可行的方案)
在这里插入图片描述
而这样的锯齿状本身的性质就比较好的来同时满足小物体大物体的分割要求(小 dilation rate 来关心近距离信息,大 dilation rate 来关心远距离信息)。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值