dilated convolution

最新推荐文章于 2022-09-07 13:43:10 发布

imperfect00

最新推荐文章于 2022-09-07 13:43:10 发布

阅读量1.2k

点赞数

分类专栏：深度学习图像处理

本文链接：https://blog.csdn.net/u011961856/article/details/77141761

版权

深度学习同时被 2 个专栏收录

71 篇文章 2 订阅

订阅专栏

图像处理

40 篇文章 0 订阅

订阅专栏

参考论文：Multi-Scale Context Aggregation by Dilated Convolutions

图像语义分割为，将图像像素点进行分类，例如FCN(全卷积网络),首先将输入图像输入CNN提取图像特征，在输入pooling层，以缩小尺寸并提高感受野。但由于是对图像的每个像素点进行分类，即输出与输入大小相同，因此pooling之后需要对其进行upsampling,以扩大图像尺寸。将图像由小变大的过程势必导致一些信息的丢失，那么就会想到是否可以不进行pooling操作，也可以增大感受野呢。本文提出的dilated convolution正是为了解决这个问题。

dilated convolution

另 $F:Z^2->R$ 为一个离散函数，k为大小为 $(2r+1)^2$ 的离散滤波器，则离散卷积操作*定义如下：
这里写图片描述
定义l为dilation 因子，*l操作定义如下：

l操作即为一个dilated convolution，也称为l-dilated convolution。我们熟悉的离散卷积也就是1-dilated convolution.
定义 $F_0,F_1,...,F_n:Z^2->R$ 为离散函数， $k_0,k_1,...,k_n-2$ 为 $3\times3$ 的离散滤波器，dilated convolution满足指数增长：
这里写图片描述
也就是说每个 $F_{i+1}$ 是由 $F_i$ 经过 $2^i$ dilated convolution得到的。每个 $F_{i+1}$ 的感受野为 $(2^{i+2}-1)\times (2^{i+2}-1)$ 。

图中， $F_1$ 是由 $F_0$ 经1-dilated convolution得到的， $F_1$ 的每个元素感受野为 $3\times3$ . $F_2$ 是由 $F_1$ 经2-dilated convolution得到的， $F_2$ 的每个元素感受野为 $7\times7$ . $F_3$ 是由 $F_2$ 经4-dilated onvolution得到的， $F_3$ 的每个元素感受野为 $15\times15$ .