ShuffleNet算法详解

最新推荐文章于 2025-03-27 20:32:27 发布

AI之路

最新推荐文章于 2025-03-27 20:32:27 发布

阅读量7.3w

点赞数 65

分类专栏：深度学习计算机视觉深度学习模型加速/模型压缩文章标签：算法深度学习与计算机视觉

本文链接：https://blog.csdn.net/u014380165/article/details/75137111

版权

ShuffleNet是一种针对移动设备优化的深度学习模型，采用channel shuffle、pointwise group convolutions和depthwise separable convolution减少计算量。它通过group操作和channel shuffle解决ResNet的边界效应问题，实现性能与效率的平衡。实验结果显示，ShuffleNet在小型网络中尤其有效，与MobileNet等模型相比表现出色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文：ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices
论文链接：https://arxiv.org/abs/1707.01083

算法详解：
ShuffleNet是Face++的一篇关于降低深度网络计算量的论文，号称是可以在移动设备上运行的深度网络。这篇文章可以和MobileNet、Xception和ResNeXt结合来看，因为有类似的思想。卷积的group操作从AlexNet就已经有了，当时主要是解决模型在双GPU上的训练。ResNeXt借鉴了这种group操作改进了原本的ResNet。MobileNet则是采用了depthwise separable convolution代替传统的卷积操作，在几乎不影响准确率的前提下大大降低计算量，具体可以参考MobileNets-深度学习模型的加速。Xception主要也是采用depthwise separable convolution改进Inception v3的结构。

该文章主要采用channel shuffle、pointwise group convolutions和depthwise separable convolution来修改原来的ResNet单元，接下来依次讲解。

channel shuffle的思想可以看下面的Figure 1。这就要先从group操作说起，一般卷积操作中比如输入feature map的数量是N，该卷积层的filter数量是M&#