Group Convolution分组卷积

最新推荐文章于 2021-03-01 23:52:23 发布

like_study_cat

最新推荐文章于 2021-03-01 23:52:23 发布

阅读量341

点赞数 2

分类专栏：特征提取网络

本文链接：https://blog.csdn.net/like_study_cat/article/details/107975063

版权

特征提取网络专栏收录该内容

14 篇文章 2 订阅

订阅专栏

写在前面

Group Convolution分组卷积，最早见于AlexNet——2012年Imagenet的冠军方法，Group Convolution被用来切分网络，使其在2个GPU上并行运行，AlexNet网络结构如下：

Convolution VS Group Convolution

在介绍Group Convolution前，先回顾下常规卷积是怎么做的，具体可以参见博文《卷积神经网络之卷积计算、作用与思想》。如果输入feature map尺寸为C∗H∗W

，卷积核有N个，输出feature map与卷积核的数量相同也是N，每个卷积核的尺寸为C∗K∗K，N个卷积核的总参数量为N∗C∗K∗K

，输入map与输出map的连接方式如下图左所示，图片来自链接：

Group Convolution顾名思义，则是对输入feature map进行分组，然后每组分别卷积。假设输入feature map的尺寸仍为C∗H∗W

，输出feature map的数量为N个，如果设定要分成G个groups，则每组的输入feature map数量为 $\frac{C}{G}$ ，每组的输出feature map数量为 $\frac{N}{G}$ ，每个卷积核的尺寸为 $\frac{C}{G}*K*K$ ，卷积核的总数仍为N个，每组的卷积核数量为NG，卷积核只与其同组的输入map进行卷积，卷积核的总参数量为 $N*\frac{C}{G}*K*K$ ，可见，总参数量减少为原来的 $\frac{1}{G}$

，其连接方式如上图右所示，group1输出map数为2，有2个卷积核，每个卷积核的channel数为4，与group1的输入map的channel数相同，卷积核只与同组的输入map卷积，而不与其他组的输入map卷积。

Group Convolution的用途

减少参数量，分成G组，则该层的参数量减少为原来的1G
Group Convolution可以看成是structured sparse，每个卷积核的尺寸由C∗K∗K变为 $\frac{C}{G}*K*K$ ，可以将其余 $(C-\frac{C}{G})*K*K$ 的参数视为0，有时甚至可以在减少参数量的同时获得更好的效果（相当于正则）。
当分组数量等于输入map数量，输出map数量也等于输入map数量，即G=N=C、N个卷积核每个尺寸为1∗K∗K时，Group Convolution就成了Depthwise Convolution，参见MobileNet和Xception等，参数量进一步缩减，如下图所示

4.更进一步，如果分组数G=N=C，同时卷积核的尺寸与输入map的尺寸相同，即K=H=W，则输出map为C∗1∗1即长度为C的向量，此时称之为Global Depthwise Convolution（GDC），见MobileFaceNet，可以看成是全局加权池化，与 Global Average Pooling（GAP） 的不同之处在于，GDC 给每个位置赋予了可学习的权重（对于已对齐的图像这很有效，比如人脸，中心位置和边界位置的权重自然应该不同），而GAP每个位置的权重相同，全局取个平均，如下图所示：

like_study_cat

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Group Convolution分组卷积

目录写在前面 Convolution VS Group Convolution Group Convolution的用途参考写在前面Group Convolution分组卷积，最早见于AlexNet——2012年Imagenet的冠军方法，Group Convolution被用来切分网络，使其在2个GPU上并行运行，AlexNet网络结构如下：Convolution VS Group Convolution在介绍Group Convolution前，先回顾下常规卷积是怎么.
复制链接

扫一扫