dilated convolution

参考论文:Multi-Scale Context Aggregation by Dilated Convolutions

图像语义分割为,将图像像素点进行分类,例如FCN(全卷积网络),首先将输入图像输入CNN提取图像特征,在输入pooling层,以缩小尺寸并提高感受野。但由于是对图像的每个像素点进行分类,即输出与输入大小相同,因此pooling之后需要对其进行upsampling,以扩大图像尺寸。将图像由小变大的过程势必导致一些信息的丢失,那么就会想到是否可以不进行pooling操作,也可以增大感受野呢。本文提出的dilated convolution正是为了解决这个问题。

dilated convolution

F:Z2>R 为一个离散函数,k为大小为 (2r+1)2 的离散滤波器,则离散卷积操作*定义如下:
这里写图片描述
定义l为dilation 因子,*l操作定义如下:
这里写图片描述

l操作即为一个dilated convolution,也称为l-dilated convolution。我们熟悉的离散卷积也就是1-dilated convolution.
定义 F0,F1,...,Fn:Z2>R 为离散函数, k0,k1,...,kn2 3×3 的离散滤波器,dilated convolution满足指数增长:
这里写图片描述
也就是说每个 Fi+1 是由 Fi 经过 2i dilated convolution得到的。每个 Fi+1 的感受野为 (2i+21)×(2i+21)
这里写图片描述
图中, F1 是由 F0 经1-dilated convolution得到的, F1 的每个元素感受野为 3×3 . F2 是由 F1 经2-dilated convolution得到的, F2 的每个元素感受野为 7×7 . F3 是由 F2 经4-dilated onvolution得到的, F3 的每个元素感受野为 15×15 .

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值