Astrous Convolution, Astrous Spatial Pyramid Pooling, Fully Connected Conditional Random Field

最新推荐文章于 2023-07-06 16:00:26 发布

起名字什么的好难

最新推荐文章于 2023-07-06 16:00:26 发布

阅读量2.7k

点赞数 2

分类专栏：论文及书籍阅读

本文链接：https://blog.csdn.net/u012428169/article/details/102799869

版权

论文及书籍阅读专栏收录该内容

43 篇文章 1 订阅

订阅专栏

翻译的一篇英文博文，原文地址见文末

Atrous Convolution 原子卷积or空洞卷积？

“Atrous”源自法语“à trous”，意思是洞。一些论文也称它为“膨胀卷积“。它通常用于小波变换，现在它被用于深度学习中的卷积。
公式：
在这里插入图片描述
当r=1时，它就是我们常用的标准卷积，当r>1时即atrous convolution，r表示卷积过程中对输入样例采样的步长（stride to sample the input sample during convolution）。
思想：

（a）是标准卷积，（b）是atrous convolution。当rate=2时，输入信号被交替采样（sampled alternatively）。首先，pad=2意味着我们在左右两边填充2个0。在rate=2的情况下，我们每2个输入采样输入信号进行卷积。因此我们得到5个输出，这使得输出的特征图变大。
如果我们记得FCN，一系列的卷积和池化使得输出的特征图非常小，而且需要32倍的上采样，这是一个很激进的上采样（aggressive upsampling）。
而且，atrous convolution扩大了滤波的视域进而能够包含更大的上下文。因此，它提供了一种有效的机制控制视野，并且在精确定位（小视野）和上下文同化（大视野）间找到了最佳平衡。
DeepLab使用VGG-16或ResNet-101，最后的池化层（pool5）或卷积（conv5_1）分别被设置为1以免抽取过多的信号。Rate=2的atrous convolution被用来替代所有后续的卷积层，输出变得大了很多。我们只需要对输出进行8倍的上采样，而双线性插值对8倍上采样具有相当好的性能。

Atrous Spatial Pyramid Pooling (ASPP) 多孔空间金字塔池化

在这里插入图片描述
ASPP实际上是空间金字塔池化（SPP）的空洞版本，这一概念已被应用到SPPNet中。在ASPP中，具有不同速率（rate）的空洞卷积并行地被应用到输入特征图上并融合在一起。
由于同一类别的对象在图像中可以有不同的比例，因此空洞空间金字塔池化可以帮助处理不同对象尺度进而提高准确性。

Fully Connected Conditional Random Field 全连接条件随机域

双线性插值后，全连接条件随机域被应用在网络输出。
在这里插入图片描述
X是像素的标签分配，p(xi)是像素i的标签分配概率。因此第一项θi是对数概率。第二项θij是一个滤波器。当xi != xj时µ = 1，当xi = xj时 µ = 0。括号中是两个内核的加权和。第一个核依赖于像素值的差异和像素位置的差异，这是一种双边滤波器，双边滤波器具有保边的特性。第二个核仅依赖于像素的位置差，这是高斯滤波。σ 和w通过交叉验证得到。
然而条件随机域是一个后处理过程，这使得DeepLabV1和DeepLabV2不再成为端到端的学习框架。它已经不被用在DeepLabV3和DeepLabV3+中。

原文地址：
Review: DeepLabv1 & DeepLabv2 — Atrous Convolution (Semantic Segmentation)

起名字什么的好难

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
Astrous Convolution, Astrous Spatial Pyramid Pooling, Fully Connected Conditional Random Field

翻译的一篇英文博文，原文地址见文末Atrous Convolution 原子卷积or空洞卷积？“Atrous”源自法语“à trous”，意思是洞。一些论文也称它为“膨胀卷积“。它通常用于小波变换，现在它被用于深度学习中的卷积。公式：当r=1时，它就是我们常用的标准卷积，当r>1时即atrous convolution，r表示卷积过程中对输入样例采样的步长（stride to sa...
复制链接

扫一扫