网络结构（1）ShufﬂeNet: An Extremely Efﬁcient Convolutional Neural Network for Mobile Devices

最新推荐文章于 2022-06-12 22:32:23 发布

volga_chen

最新推荐文章于 2022-06-12 22:32:23 发布

阅读量876

点赞数 1

分类专栏：网络结构文章标签： ShuffleNet 轻量级网络

本文链接：https://blog.csdn.net/volga_chen/article/details/86062795

版权

网络结构专栏收录该内容

2 篇文章 0 订阅

订阅专栏

论文目录

ShufﬂeNet: An Extremely Efﬁcient Convolutional Neural Network for Mobile Devices

ShufﬂeNet: An Extremely Efﬁcient Convolutional Neural Network for Mobile Devices

本文针对计算资源非常有限(10-150 MFLOPs)的移动设备，提出了一种极端高效计算的CNN网络结构ShuffleNet。为了在保证精度的情况下减少大量计算，使用了两种新的操作：group convolution和channel shuffle。在ImageNet分类和MS COCO检测上都体现出了极好的结果。如：ImageNet上top-1 error比MobileNet低7.8%（同40MFLOPs），而同精度时比AlexNet快13倍。

引言

现在的神经网络趋向于用大而深的网络来解决大型视觉任务，然而在实际需求上则是要在有限的计算负担下来获得最高的准确率，注重于移动平台。许多工作侧重于在基础网络结构上剪枝、压缩，而我们则希望设计出一种高效的基本结构。

我们发现现在的模型如Xception和ResNetXt因为1x1的卷积而变得低效。我们使用pointwise group convolution来减少1x1的总面积。为了克服其副作用，我们设计了channel shuffle操作使信息可以在特征通道之间流动。基于以上两点设计的ShuffleNet，与以往的结构相比在相同的计算量下可以有更多的特征通道，从而编码更多信息提升性能。

实现

针对组卷积的通道混洗

一般卷积神经网络包含有相同结构的重复，在其中，Xception和ResNeXt引入了高效的深度可分享卷积（DWConv）或组卷积（GConv）。然而，我们发现这些设计都没有充分考虑1x1卷积（逐点总面积）大量的计算，比如在ResNeXt中只有3x3的卷积层用上了组卷积，使得1x1卷积的乘-加操作占了整个网络的93.4%。尤其是在小网络中，逐点卷积的计算量常常使通道数受到限制，从而损害精度。

一种解决这个问题的方案是通道间稀疏连接，如组卷积。然而，如果许多组卷积层叠在一起，就会产生副作用：某一通道的输出只从一小部分输入通道中得到。这使得通道间的信息流动被阻塞，表征能力变弱。

如果我们允许GConv去获取不同组的输入，那么输入输出就会被完全关联上。特别是对于前一层生成的特征图，我们可以先把这一层的每一组通道分小组，然后给下一层的每一组输送不同小组的通道。通道混洗即是实现的一种办法。若前一层有g组，我们先把前一层的输出划分为gxn个小组，然后将其转置、再压平变成下一层输入——即使下一层分组数不同这个方案也是可行的。同时，通道混洗是可微的，就可以在端到端训练中使用。