ShuffleNet
论文:ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices
论文链接:https://arxiv.org/abs/1707.01083
- group conv 与 channel shuffle
分组卷积(group conv)将卷积输入从通道数上等分成多个组,相应的卷积核也会在通道数维度上等分成多个组,计算卷积时一个输入分组与一个卷积核分组计算出一个 featureMap,那么一个卷积输入(包含多个输入分组)与一个卷积核(包含多个卷积核分组)计算得出多个featureMap,为计算出原始的 featureMaps,只需更少的卷积核数量,从而卷积核参数量核计算量都降低了。
分组卷积中利用局部通道上的卷积降低了卷积核参数量核计算量,但是分组卷积只融合了卷积输入部分通道的信息。channel shuffle将分组卷积的输出featureMap在通道维度上重新映射,称为shuffle,如下图(a)->©所示,过程如图(b)。
shuffle的具体细节如下图所示,将g*n个通道分组reshape成(g,n),再转置为(n,g),平坦化,再分回g组作为下一层的输入。