Astrous Convolution, Astrous Spatial Pyramid Pooling, Fully Connected Conditional Random Field

翻译的一篇英文博文,原文地址见文末

Atrous Convolution 原子卷积or空洞卷积?

“Atrous”源自法语“à trous”,意思是洞。一些论文也称它为“膨胀卷积“。它通常用于小波变换,现在它被用于深度学习中的卷积。
公式:
在这里插入图片描述
当r=1时,它就是我们常用的标准卷积,当r>1时即atrous convolution,r表示卷积过程中对输入样例采样的步长(stride to sample the input sample during convolution)。
思想:
在这里插入图片描述
(a) 是标准卷积,(b)是atrous convolution。当rate=2时,输入信号被交替采样(sampled alternatively)。首先,pad=2意味着我们在左右两边填充2个0。在rate=2的情况下,我们每2个输入采样输入信号进行卷积。因此我们得到5个输出,这使得输出的特征图变大。
如果我们记得FCN,一系列的卷积和池化使得输出的特征图非常小,而且需要32倍的上采样,这是一个很激进的上采样(aggressive upsampling)。
而且,atrous convolution扩大了滤波的视域进而能够包含更大的上下文。因此,它提供了一种有效的机制控制视野,并且在精确定位(小视野)和上下文同化(大视野)间找到了最佳平衡。
DeepLab使用VGG-16或ResNet-101,最后的池化层(pool5)或卷积(conv5_1)分别被设置为1以免抽取过多的信号。Rate=2的atrous convolution被用来替代所有后续的卷积层,输出变得大了很多。我们只需要对输出进行8倍的上采样,而双线性插值对8倍上采样具有相当好的性能。

Atrous Spatial Pyramid Pooling (ASPP) 多孔空间金字塔池化

在这里插入图片描述
ASPP实际上是空间金字塔池化(SPP)的空洞版本,这一概念已被应用到SPPNet中。在ASPP中,具有不同速率(rate)的空洞卷积并行地被应用到输入特征图上并融合在一起。
由于同一类别的对象在图像中可以有不同的比例,因此空洞空间金字塔池化可以帮助处理不同对象尺度进而提高准确性。

Fully Connected Conditional Random Field 全连接条件随机域

双线性插值后,全连接条件随机域被应用在网络输出。
在这里插入图片描述
X是像素的标签分配,p(xi)是像素i的标签分配概率。因此第一项θi是对数概率。第二项θij是一个滤波器。当xi != xj时µ = 1,当xi = xj时 µ = 0。括号中是两个内核的加权和。第一个核依赖于像素值的差异和像素位置的差异,这是一种双边滤波器,双边滤波器具有保边的特性。第二个核仅依赖于像素的位置差,这是高斯滤波。σ 和w通过交叉验证得到。
然而条件随机域是一个后处理过程,这使得DeepLabV1和DeepLabV2不再成为端到端的学习框架。它已经不被用在DeepLabV3和DeepLabV3+中。

原文地址:
Review: DeepLabv1 & DeepLabv2 — Atrous Convolution (Semantic Segmentation)

相关博文:
论文阅读理解 - (Deeplab-V3)Rethinking Atrous Convolution for Semantic Image Segmentation
DeepLab V2 论文笔记

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值