可分离卷积基本介绍

可分离卷积基本介绍

本文为 AI 研习社编译的技术博客,原标题 :

A Basic Introduction to Separable Convolutions

作者 | Chi-Feng Wang

翻译 | 通夜、秃了少年头     编辑 | 王立鱼、Pita

原文链接:

https://towardsdatascience.com/a-basic-introduction-to-separable-convolutions-b99ec3102728

任何看过MobileNet架构的人都会遇到可分离卷积(separable convolutions)这个概念。但什么是“可分离卷积”,它与标准的卷积又有什么区别?可分离卷积主要有两种类型:

  • 空间可分离卷积(spatial separable convolutions)

  • 深度可分离卷积(depthwise separable convolutions)

  空间可分离卷积

从概念上讲,这是两者中较容易的一个,并说明了将一个卷积分成两部分(两个卷积核)的想法,所以我将从这开始。 不幸的是,空间可分离卷积具有一些显着的局限性,这意味着它在深度学习中没有被大量使用。

空间可分卷积之所以如此命名,是因为它主要处理图像和卷积核(kernel)的空间维度:宽度和高度。 (另一个维度,“深度”维度,是每个图像的通道数)。

空间可分离卷积简单地将卷积核划分为两个较小的卷积核。 最常见的情况是将3x3的卷积核划分为3x1和1x3的卷积 核,如下所示:

可分离卷积基本介绍

图1:在空间上分离3x3内核

现在,我们不是用9次乘法进行一次卷积,而是进行两次卷积,每次3次乘法(总共6次),以达到相同的效果。 乘法较少,计算复杂性下降,网络运行速度更快。 

  • 4
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: EfficientNet结构中的高效率卷积模块(Efficient Convolutional Module)是由MBConv块组成的。MBConv块由一个点卷积、一个扩张卷积和一个深度卷积组成。点卷积用来降低模型的复杂度,扩张卷积用来增加模型的容量,深度卷积用来控制通道数。在EfficientNet结构中,MBConv块会被重复使用,每一次使用都会增加输入的通道数,同时减少输出的通道数。这样做的好处是可以使模型的复杂度与容量适度平衡。 ### 回答2: EfficientNet是一种高效率的卷积神经网络结构,其中的高效率卷积模块是其核心组成部分之一。高效率卷积模块通过结合轻量化网络设计和自动网络缩放,使得EfficientNet能够在保持高准确性的同时,拥有更小的参数数量和计算复杂度。 高效率卷积模块主要包含两个关键的组件:深度可分离卷积和通道注意力。 深度可分离卷积是高效率卷积模块的基本构建模块。传统的卷积操作包括卷积核在空间维度和通道维度上同时滑动,而深度可分离卷积将这两个维度分开处理。首先,一个较小的卷积核在空间维度上对输入进行卷积操作,然后在通道维度上进行1x1卷积操作。这种分离的方式不仅显著减少了参数数量,还能降低计算复杂度。 通道注意力是为了进一步提高特征表示能力而添加的。通道注意力模块可以自适应地对通道维度进行加权,使得网络更加关注重要的特征通道。通道注意力模块通过考虑每个通道的全局平均池化特征,并通过两个全连接层产生一个通道权重向量。最后,通道权重被用来对特征通道进行加权,从而获得更加具有区分度和重要性的特征表示。 高效率卷积模块的设计理念是结合轻量化网络和自动网络缩放的思想,充分利用网络结构的参数和计算资源。这样的设计使得EfficientNet在保持较小模型规模的同时,表现出优秀的准确性和高效的计算性能。因此,高效率卷积模块在卷积神经网络的设计中起到了重要的作用。 ### 回答3: EfficientNet是一种高效率的卷积神经网络结构,在其内部采用了一种称为高效率卷积模块的设计。高效率卷积模块的目标是在保持准确性的前提下降低计算复杂度和参数量。 高效率卷积模块的核心思想是使用两个不同大小的卷积核来处理输入特征图。一个较小的卷积核(例如3x3)用于提取较细的特征,而一个较大的卷积核(例如5x5和7x7)用于提取较粗的特征。这种多尺度的卷积操作有助于网络同时捕捉到全局和局部的特征。 在高效率卷积模块中,两个不同尺度的卷积操作后会进行一个特征融合的操作。特征融合操作的目的是将两个尺度的特征进行适当的组合,以增强特征的表达能力。在EfficientNet中,特征融合通过一个混合操作实现,它通过调整两个尺度的特征的权重来平衡它们之间的贡献。 此外,高效率卷积模块还引入了一种称为Squeeze-and-Excitation(SE)模块的机制。SE模块的目的是自适应地学习通道间的相关性,以进一步增强特征的重要性。SE模块通过使用全局平均池化操作来获取特征图中每个通道的全局统计信息,并通过两个全连接层来学习每个通道的权重。这些权重被用来重新加权特征图中的每个通道,以提高重要特征的响应。 综上所述,高效率卷积模块是EfficientNet中的核心组件之一。它通过多尺度的卷积操作和特征融合,以及引入SE模块来实现高效率的特征提取和增强特征表达能力。这些设计策略使得EfficientNet在保持较高准确性的同时具备更高的计算效率和较少的参数量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值