ShuffleNet总结

最新推荐文章于 2024-05-25 11:03:00 发布

hr_net

最新推荐文章于 2024-05-25 11:03:00 发布

阅读量325

点赞数 1

分类专栏：文献阅读深度学习文章标签：深度学习文献阅读

本文链接：https://blog.csdn.net/qq_38742161/article/details/85113617

版权

深度学习同时被 2 个专栏收录

45 篇文章 2 订阅

订阅专栏

文献阅读

5 篇文章 0 订阅

订阅专栏

论文：ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices
论文链接：https://arxiv.org/abs/1707.01083

参考博客：@Thaurun https://www.cnblogs.com/heguanyou/p/8087422.html

目前许多CNNs模型往深度更深的方向发展，但是这类深度网络模型难以运行在移动设备上。针对上述问题，部分研究集中在对现有预训练模型的修剪、压缩或使用低精度数据表示。

在2017年末，Face++发了一篇论文ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices讨论了一个极有效率且可以运行在手机等移动设备上的网络结构——ShuffleNet。ShuffleNet的工作专注于设计更好的模型，直接提高性能，而不是加速或转换现有模型。

ShuffleNet通过在残差模块上添加分组卷积与1×1的卷积核来降低计算量，通过重组通道来丰富各个通道的信息。这个论文的mxnet源码的开源地址为：MXShuffleNet。

文章创造思路：最先进的网络例如Xception和ResNeXt将有效的深度可分离卷积或群卷积引入构建block中，在表示能力和计算消耗之间取得很好的折中。但是，我们注意到这两个设计都没有充分采用1×1的逐点卷积，因为这需要很大的计算复杂度。在小型网络中，昂贵的逐点卷积造成有限的通道之间充满约束，这会显著的降低精度。为了解决这个问题，一个直接的方法是应用通道稀疏连接，例如组卷积(group convolutions)。通过确保每个卷积操作仅在对应的输入通道组上，组卷积可以显著的降低计算损失。然而，如果多个组卷积堆叠在一起，会有一个副作用：某个通道输出仅从一小部分输入通道中导出。交叉连接或者shuffle的形式便应用到分组卷积之中以进行组别之间的信息交互。shuffle 具体来说是 channel shuffle，是将各部分的 feature map 的 channel 进行有序的打乱，构成新的 feature map，以解决 group convolution 带来的 信息流通不畅 问题。（MobileNet 是用 point-wise convolution 解决的这个问题）。ShuffleNet将输入的group进行打散，从而保证每个卷积核的感受野能够分散到不同group的输入中，增加了模型的学习能力。

讨论分组卷积与卷积核大小对计算量的影响

为什么用分组卷积与小的卷积核会减少计算的复杂度呢？

不分组且只有一个样本

在不分组与输入的样本量为1（batch_size=1）的条件下，输出一个通道上的一个点是卷积核会与所有的通道卷积之积，如图1所示：

图1 输入层（第一层）只有一个通道，那个第二层一个通道上的点是第一层通道相应区域与相应卷积核的卷积，第三层一个通道上的点是与第二层所有通道上相应区域与相应卷积核的卷积，而且对于输出通道每个输入通道对应的卷积核是不一样的，不同的输出通道也有不同的卷积核，所以说卷积核的参数量是Cout×Cin×Kh×Kw