空洞卷积与反卷积

空洞卷积(dilated conv)可在不增加参数或计算量的情况下增大模型的感受野,适用于需要全局信息的任务。它通过调整rate参数实现不同频率的采样,扩大感受野。反卷积则用于图像尺寸的上采样,常用于图像分割任务。两者在图像处理和序列模型中各有其独特作用。
摘要由CSDN通过智能技术生成

空洞卷积(dilated conv),也称扩张卷积。空洞卷积可以在kernel有效增大感受野的同时不增加模型参数或者计算量。在图像需要全局信息或者语音文本需要较长的sequence信息依赖的问题中,都能较好的应用空洞卷积。在图像分割,语音合成WaveNet,机器翻译ByteNet中都有空洞卷积的身影。

一般情况下,图片输入到网络中,网络将会对图像做卷积再池化(pooling)的操作,pooling的操作即降低了图像尺寸的同时增大感受野。但由于图像分割预测是pixel-wise的输出,所以将pooling后较小的图像上采样(upsampling)到原始的图像尺寸进行预测一般需要采用反卷积(deconv)操作。之前pooling一般为max pooling,所以该pooling操作使得每个pixel能预测都能看大较大感受野信息。

所以在图像分割网络中有两个关键点:
1、pooling减少图片的尺寸增大感受野
2、通过upsampling扩大图片尺寸。

由于在先减少再增大的过程中肯定会有一些信息损失,为了减少由pooling带来信息损失,所以就提出空洞卷积,他能不通过pooling来增大感受野。
第一个是正常卷积

在空洞卷积中有个重要的参数叫raterate,这个参数代表了空洞的大小。
要理解空洞概念和如何操作可以从两个角度去看
1)从原图角度,所谓空洞就是在原图上做采样。采样的频率是根据rate参数来设置的,当rate为1时候,就是原图不丢失任何信息采样,此时卷积操作就是标准的卷积

  • 9
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值