【轻量级网络系列二】ShuffleNet:An Extremely Efficient Convolutional Neural Network for Mobile Devices论文总结

最新推荐文章于 2023-12-11 10:49:48 发布

slamdunkofkd

最新推荐文章于 2023-12-11 10:49:48 发布

阅读量362

点赞数 2

分类专栏：深度学习文章标签：卷积深度学习计算机视觉神经网络

本文链接：https://blog.csdn.net/slamdunkofkd/article/details/106100665

版权

深度学习专栏收录该内容

26 篇文章 0 订阅

订阅专栏

前言

ShuffleNet是被设计来手机设备上(这种算力比较有限，一般在10-150MFLOPs左右)。这里的FLOPs：全称 floating point operations per second，意指每秒浮点运算次数，可以大致理解为算力评估的一个标准。ShuffleNet利用了pointwise group convolution and channel shuffle操作来达到减小计算量的效果。

现在的CNN模型所取到很好的结果上，FLOPs往往达到十亿次，本论文探求一种在保持FLOPs在10-100M数量级左右，以保证这些model可以很好的运行在移动平台上，如智能手机，机器人等。现有的小网络都是通过对原网络进行修剪，压缩来进行的。ShuffleNet使用pointwise group convolution来替代1*1卷积，以下降计算复杂度。而channel shuffle是用来克服pointwise group convolution带来的副作用。

方法

Channel Shuffle for Group Convolutions

Xception和ResNeXt高效使用了depthwise separable convolutions或者group convolutions。但是，这两个model都没有完全的使用好1*1卷积，1*1卷积（也被叫做pointwise convolutions）是传统CNN模型里面很费计算量的一部分。比如在ResNeXt中的残差单元1*1卷积在乘加部分占了93.4%。在小的网络中，1*1卷积造成了限制通道数量，这样才可以减小计算复杂度，但由于通道数量的减少导致了准确率的下降。

为了解决这个问题，可以应用通道稀疏连接，例如是组卷积，通常用在1*1卷积上。在这里，作者列举了两个组卷积的模式，以及一个他们怎么处理组卷积的。如图1(a)就描述了组卷积带来的问题，每一组对应了之前输入组的输出，这样就导致了数据流动方式(在图上就是同一个颜色)一致，导致网络的拟合特征能力下降。可以像图1(b)一样可以通过随机打乱输出通道对应之前的组。而作者在此提出一种等价于(b)的模式(如图1(c))，原文这么描述，输入通道有g组，输出通道为g*n组，帮他reshape成(g,n)，将其转置。在这里，我的理解就是一开始有g组，后面将输出通道分为n组，这样就保证了每个组之间都有信息交换。这个Channel Shuffle是可导的，所以整个过程是可以完成一个端到端的训练过程。

ShuffleNet Unit

ShuffleNet Unit是对于residual block的改进，首先对于残差块的3*3卷积替换成3*3的depthwise convolution，这样的结构描述在图2(a)中，在将其中耗时的1*1卷积替换成1*1组卷积和Channel Shuffle，在这里只有一个1*1卷积使用了Channel Shuffle，作者解释说是为了简便，而且会在后面实验部分给出对比数据。值得注意的是，在depthwise convolution之后作者并没有使用ReLU激活函数。而在ShuffleNet unit中3*3卷积有stride的版本里，作者做了两个修正，首先对于短路连接中x做了一个平均池化，之后对于本来是相加的操作改成了通道concat，来在不怎么耗费计算力的前提下提高通道的数量。

得益于组卷积和Channel Shuffle，ShuffleNet unit比ResNet和ResNeXt计算量要少很多，如果输入的特征大小为 $C*H*W$ ,bottleneck的通道为 $m$ ，分组卷积的组数为 $g$ ，那么ResNet unit需要 $hw(2cm+9m^{2})$ FLOPs,ResNeXt需要 $hw(2cm+9m^{2}/g)$ FLOPs。而ShuffleNet unit仅需要 $hw(2cm/g+9m)$ ，可以看到，大约是ResNet和ResNeXt的 $1/m$ ， $g/m$ 倍。

尽管depthwise convolution很好，可以减少计算复杂度，但是在ShuffleNet中只用在bottleneck feature maps(即上图中的unit)。因为他们发现在低电源移动设备上，很难完全的使用depthwise convolution的效益，由于计算/内存访问率较低。

网络结构

网络结构总体情况就如上表所示，ShuffleNet的网络结构很像ResNet，就把ResNet的unit改成ShuffleNet unit，每个stage的第一模块是stride为2的卷积，然后bottleneck的channel是输出的四分之一。文章中也给出了几种不同组数的情况以及复杂度，都控制在140MFLOPs左右。在同样的计算复杂度限制下，分组数越多，导致输出通道数越多，这帮助网络编码更多的信息，但也会导致一些不好的作用，作者在实验小节描述了这种作用。

在本小节的最后，作者用了一个放缩通道的因子 $s$ 来表示对于上表中通道的放缩，上表中代表1个单位，之后的0.5X，0.25X就是通道是上表中的一半和四分之一。

实验部分

对于超参数的设计，本文大部分的参数保持着和残差网络那篇一样，有两个例外，第一个权重衰减调小了，还用了线性衰减学习率；第二个就是在数据处理中较少的使用尺寸规模扩大。

slamdunkofkd

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【轻量级网络系列二】ShuffleNet:An Extremely Efficient Convolutional Neural Network for Mobile Devices论文总结

前言ShuffleNet是被设计来手机设备上(这种算力比较有限，一般在10-150MFLOPs左右)。这里的FLOPs：全称floating point operations per second，意指每秒浮点运算次数，可以大致理解为算力评估的一个标准。ShuffleNet利用了pointwise group convolution and channel shuffle操作来达到减小计算量的效果。现在的CNN模型所取到很好的结果上，FLOPs往往达到十亿次，本论文探求一种在保持FLOPs在10-.
复制链接

扫一扫