ShuffleNetV2 网络深度解析与Pytorch实现

最新推荐文章于 2024-05-27 21:33:42 发布

追逐AI的蜗牛

最新推荐文章于 2024-05-27 21:33:42 发布

阅读量2.9k

点赞数 4

分类专栏：卷积神经网络CNN 文章标签：轻量化网络 ShuffleNet V2 分组卷积

本文链接：https://blog.csdn.net/qq_38675397/article/details/104249654

版权

卷积神经网络CNN 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

Table of Contents

论文：ShuffleNet V2: Practical Guidelines for Ecient CNN Architecture Design
论文链接：https://arxiv.org/abs/1807.11164

　　ShuffleNet V2是ShuffleNet的升级版(了解ShuffleNet请移步博客ShuffleNet网络深入解析)，该论文是通过理论与实验的方法，得出了四条结论来指导网络结构设计，使得网络的运行速度更快．

设计理念

　　网络运行速度不只是受到FLOPs(float-point operations)的影响，内存访问同样是需要消耗时间的，该论文从内存访问量(MAC)的角度来指导网络的设计．

1.通道数相等时最小化内存访问量(MAC)
　　假设一个1*1卷积层的输入特征通道数是c1，输出特征尺寸是h和w，输出特征通道数是c2，那么这样一个1*1卷积层的FLOPs就是下面式子所示，更具体的写法是B=1*1*c1*c2*h*w，这里省略了1*1。
　　　　　　　　　　　　　　　　　　　　　　 è¿éåå¾çæè¿°
　　接下来看看存储空间，因为是1*1卷积，所以输入特征和输出特征的尺寸是相同的，这里用h和w表示，其中hwc1表示输入特征所需存储空间，hwc2表示输出特征所需存储空间，c1c2表示卷积核所需存储空间。
　　　　　　　　　　　　　　　　　　　 è¿éåå¾çæè¿°
　　根据均值不等式可以得到公式1。接下来有意思了，把MAC和B代入式子1，就得到（c1-c2）^2>=0，因此等式成立的条件是c1=c2，也就是输入特征通道数和输出特征通道数相等时，在给定FLOPs前提下，MAC达到取值的下界。
　　　　　　　　　　　　　　　　　　　 è¿éåå¾çæè¿°
2.过量使用组卷积会增加MAC

　　带group操作的1*1卷积的FLOPs如下所示，多了一个除数g，g表示group数量。这是因为每个卷积核都只和c1/g个通道的输入特征做卷积，所以多个一个除数g。
　　　　　　　　　　　　　　　　　　　　　　　 è¿éåå¾çæè¿°
　　MAC如下所示，和前面不同的是这里卷积核的存储量多了除数g，和B同理。
　　　　　　　　　　　　　　　　　　　　
　　如公式2所示，可以看出在B不变时，g越大，MAC也越大。
　　　　　　　　　　　　　　　　　　 è¿éåå¾çæè¿°
3.网络碎片化会降低并行度

　　模型的分支数量会影响模型的速度，分支数量越少，模型速度越快．

4.元素级(element-wise)操作影响模型速度

　　element-wise操作所带来的时间消耗远比在FLOPs上的体现的数值要多，因此要尽可能减少element-wise操作。