分组卷积，分离卷积

最新推荐文章于 2024-07-19 14:43:16 发布

wanghua609

最新推荐文章于 2024-07-19 14:43:16 发布

阅读量5.2k

点赞数 1

本文链接：https://blog.csdn.net/weixin_38145317/article/details/89203226

版权

本文介绍了深度学习中几种重要的卷积操作，包括分组卷积、3×3卷积核的优势、Inception结构、Bottleneck层、DepthWise卷积、ResNet残差网络、ShuffleNet的通道洗牌以及SEnet的通道注意力机制。这些技术旨在减少计算量、提高模型性能，并探索卷积操作的新形态。

摘要由CSDN通过智能技术生成

参考网址：https://blog.csdn.net/mmc2015/article/details/77745768

一、分组卷积 Group convolution

Group convolution 分组卷积，最早在AlexNet中出现，由于当时的硬件资源有限，训练AlexNet时卷积操作不能全部放在同一个GPU处理，因此作者把feature maps分给多个GPU分别进行处理，最后把多个GPU的结果进行融合。

AlexNet

分组卷积的思想影响比较深远，当前一些轻量级的SOTA（State Of The Art）网络，都用到了分组卷积的操作，以节省计算量。但题主有个疑问是，如果分组卷积是分在不同GPU上的话，每个GPU的计算量就降低到 1/groups，但如果依然在同一个GPU上计算，最终整体的计算量是否不变？

二、卷积核一定越大越好？-- 3×3卷积核

AlexNet中用到了一些非常大的卷积核，比如11×11、5×5卷积核，之前人们的观念是，卷积核越大，receptive field（感受野）越大，看到的图片信息越多，因此获得的特征越好。虽说如此，但是大的卷积核会导致计算量的暴增，不利于模型深度的增加，计算性能也会降低。于是在VGG（最早使用）、Inception网络中，利用2个3×3卷积核的组合比1个5×5卷积核的效果更佳，同时参数量（3×3×2+1 VS 5×5×1+1）被降低，因此后来3×3卷积核被广泛应用在各种模型中。

三、每层卷积只能用一种尺寸的卷积核？-- Inception结构

传统的层叠式网络，基本上都是一个个卷积层的堆叠，每层只用一个尺寸的卷积核，例如VGG结构中使用了大量的3×3卷积层。事实上，同一层feature map可以分别使用多个不同尺寸的卷积核，以获得不同尺度的特征，再把这些特征结合起来，得到的特征往往比使用单一卷积核的要好，谷歌的GoogLeNet，或者说Inception系列的网络，就使用了多个卷积核的结构：

补充内容：什么是feature map？</