语义分割模型-DeepLab

本文详细介绍了DeepLab系列模型,特别是DeepLab v1和v2,重点讨论了空洞卷积、全连接的条件随机场(CRF)、多尺度预测以及Atrous Spatial Pyramid Pooling(ASPP)。DeepLab通过空洞卷积扩大感受野,解决了分辨率降低的问题,同时通过ASPP捕获多尺度信息,提高了语义分割的准确性。
摘要由CSDN通过智能技术生成

语义分割模型-DeepLab

介绍下DeepLab系列,由谷歌推出的针对语义分割的模型,到目前为止,共有四个版本,这里重点介绍下前两个版本,由于时间原因,并没有来得及读v3+的论文
针对其中用到的主要方法,和大家分享下

  1. 空洞卷积
  2. 结构化预测—全连接的CRF
  3. 多尺度预测—ASPP

空洞卷积

空洞卷积(Dilated Convolution/Atrous Convolution):在标准卷积核的两个相邻元素间填充0。 dilated rate:即扩张率,当其为r时, 卷积核两个相邻元素间填充(r-1)个0。可认为标准卷积是空洞卷积的一个特殊形式。
在这里插入图片描述
例如第一个例子:它扩张完后的大小为:5=3+(3-1)*(2-1)
在这里插入图片描述
空洞卷积的计算量是不变的,卷积的过程是完全相同的,只是卷积核变了一下
作用:

  1. 不丢失分辨率、不增加计算量的同时,扩大了感受野:在传统DCNN中,取消后两个Pooling层,并用空洞卷积替代原本的标准卷积。
  2. 捕获多尺度上下文信息:通过设置dilated rate参数,来获取不同尺寸的感受野,即获取了多尺度信息。

首先解释一下第一个作用

下面的第一幅图片是标准卷积,核为3,步长和padding为1
第二幅图片是扩张率为2的卷积。
在这里插入图片描述
在这里插入图片描述
第一个的一个输出特征跨了3个输入特征;下面的一个输出特征跨了5个输入特征。
空洞卷积在计算量不增大的前提下,可以有效增大感受野
既然它扩大了感受野,那原来用于扩大感受野的pooling操作就可以去掉了,这样也就保持了图片的分辨率

那么膨胀率能一味增大么?感受野能一味增大么?
答案是不能。下面看一个图片
在这里插入图片描述
DeepLa

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值