深度学习中不同类型的卷积的介绍

#翻译自https://towardsdatascience.com/types-of-convolutions-in-deep-learning-717013397f4d#

Convolutions

包含Kernel size,Stride,Padding

Dialated Convolutions

膨胀卷积给卷积层引入了另外一个参数命名为膨胀率(dilation rate)。这个参数定义了kernel中的值之间的间隔,dilation rate为2的一个3x3的kernel将和一个5x5的kernel拥有相同的感受野,同时只使用了9个参数。想象一下,获取一个5x5内核并删除每一个第二列和一行。

这个方法传递了一个更宽的感受野使用相同的计算代价。膨胀卷积在实时分割领域是特别流行的。如果您需要广泛的视野并且无法承受多个卷积或更大的内核,请使用它们。

Transposed Convolutions

有些来源使用名称deconvolution,这是不合适的,因为它不是deconvolution。 为了使事情更糟,确实存在deconvolution,但它们在深度学习领域并不常见。实际的反卷积会使卷积过程恢复。 想象一下,将图像输入到单个卷积层中。 现在取出输出,将它扔进一个黑盒子里然后再出现原始图像。 这个黑盒子进行反卷积。 它是卷积层的数学逆。

转置卷积有点类似,因为它产生与假设的反卷积层相同的空间分辨率。 但是,对值执行的实际数学运算是不同的。 转置卷积层执行常规卷积,但恢复其空间变换。

此时你应该很困惑,让我们看一个具体的例子。 将5×5的图像送入卷积层。 步幅设置为2,填充停用,内核为3x3。 这产生2x2图像。

如果我们想要反转这个过程,我们需要逆数学运算,以便从我们输入的每个像素生成9个值。 然后,我们以2的步幅遍历输出图像。这将是反卷积。

转置卷积不会这样做。 唯一的共同点是它保证输出也是5x5图像,同时仍然执行正常的卷积操作。 为此,我们需要在输入上执行一些花哨的填充。

正如您现在可以想象的那样,此步骤不会从上面颠倒过程。 至少不涉及数值。

它只是从之前重建空间分辨率并执行卷积。 这可能不是数学逆,但对于编码器 - 解码器架构,它仍然非常有用。 这样我们就可以将图像的升级与卷积相结合,而不是进行两个单独的处理。

Separable Convolutions

在可分离的卷积中,我们可以将内核操作分成多个步骤。 让我们将卷积表示为y = conv(x,k),其中y是输出图像,x是输入图像,k是内核。 简单。 接下来,假设k可以通过以下公式计算:k = k1.dot(k2)。 这将使它成为可分离的卷积,因为我们可以通过用k1和k2进行2个1D卷积来得到相同的结果,而不是用k进行2D卷积。

编辑:实际上,通过堆叠1xN和Nx1内核层,可以创建与空间可分离卷积非常相似的东西。这最近在一个名为EffNet的架构中使用,显示了有希望的结果。

在神经网络中,我们通常使用称为深度可分离卷积的东西。这将执行空间卷积,同时保持通道分离,然后进行深度卷积。在我看来,通过一个例子可以最好地理解它。

假设我们在16个输入通道和32个输出通道上有一个3x3卷积层。详细情况是,16个3x3内核遍历16个通道中的每一个,产生512(16x32)个特征映射。接下来,我们通过添加它们来合并每个输入通道中的1个特征图。由于我们可以做32次,我们得到了我们想要的32个输出通道。

对于同一示例中的深度可分离卷积,我们遍历16个通道,每个通道有1个3x3内核,为我们提供16个特征映射。现在,在合并任何东西之前,我们遍历这16个特征映射,每个特征映射有32个1x1卷积,然后才开始将它们加在一起。这导致656(16x3x3 + 16x32x1x1)参数与上面的4608(16x32x3x3)参数相反。

该示例是深度可分离卷积的特定实现,其中所谓的深度乘数为1.这是迄今为止这种层的最常见设置。

我们这样做是因为空间和深度信息可以解耦的假设。看一下Xception模型的表现,这个理论似乎有效。由于其有效使用参数,深度可分离卷积也用于移动设备。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值