关闭

dilated convolution

14人阅读 评论(0) 收藏 举报
分类:

参考论文:Multi-Scale Context Aggregation by Dilated Convolutions

图像语义分割为,将图像像素点进行分类,例如FCN(全卷积网络),首先将输入图像输入CNN提取图像特征,在输入pooling层,以缩小尺寸并提高感受野。但由于是对图像的每个像素点进行分类,即输出与输入大小相同,因此pooling之后需要对其进行upsampling,以扩大图像尺寸。将图像由小变大的过程势必导致一些信息的丢失,那么就会想到是否可以不进行pooling操作,也可以增大感受野呢。本文提出的dilated convolution正是为了解决这个问题。

dilated convolution

F:Z2>R为一个离散函数,k为大小为(2r+1)2的离散滤波器,则离散卷积操作*定义如下:
这里写图片描述
定义l为dilation 因子,*l操作定义如下:
这里写图片描述

l操作即为一个dilated convolution,也称为l-dilated convolution。我们熟悉的离散卷积也就是1-dilated convolution.
定义F0,F1,...,Fn:Z2>R为离散函数,k0,k1,...,kn23×3的离散滤波器,dilated convolution满足指数增长:
这里写图片描述
也就是说每个Fi+1是由Fi经过2idilated convolution得到的。每个Fi+1的感受野为(2i+21)×(2i+21)
这里写图片描述
图中,F1是由F0经1-dilated convolution得到的,F1的每个元素感受野为3×3.F2是由F1经2-dilated convolution得到的,F2的每个元素感受野为7×7.F3是由F2经4-dilated onvolution得到的,F3的每个元素感受野为15×15.

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:11641次
    • 积分:751
    • 等级:
    • 排名:千里之外
    • 原创:65篇
    • 转载:0篇
    • 译文:0篇
    • 评论:0条