ShuffleNet v2

最新推荐文章于 2024-01-01 17:08:24 发布

xiaochengJF

最新推荐文章于 2024-01-01 17:08:24 发布

阅读量169

点赞数

分类专栏：目标检测文章标签：深度学习卷积神经网络计算机视觉目标检测

本文链接：https://blog.csdn.net/weixin_43711554/article/details/109050137

版权

目标检测专栏收录该内容

41 篇文章 1 订阅

订阅专栏

论文：ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design（ECCV 2018）

文章目录

ShuffleNet v2设计原则

从实际效果触发，确立一些建立高效网络的基本设计原则，在 ShuffleNet v1 $^{【1】}$ 基础上改进

通道比例

FLOPs (floating point of operations)：浮点运算次数，衡量算法/模型复杂度
MFLOPs (million floating point of operations)

由下图可知：FLOPs相近的模型精度和运行速度均相差较大，那么FLOPs作为衡量模型速度的指标是不准确的

在这里插入图片描述
FLOPs相同为什么速度却差别较大？
FLOPs 虽然相同，但是内存访问消耗时间 MAC(memory access cost)不一样

例：若输入特征通道数为 $c_1$ ，卷积核尺寸为 $1\times 1$ ，步长为1，输出特征通道数为 $c_2$ 、尺寸为 $h\times w$ ，则该卷积层 FLOPs
$B=hwc_1c_2$

所需存储空间：输入特征 + 输出特征 + 卷积核
$\begin{aligned} \text {MAC}&=hw(c_1+c_2)+c_1c_2\\ &\geq hw2\sqrt{c_1c_2}+c_1c_2\\ &= 2\sqrt{hwB}+\frac{B}{hw} \end{aligned}$

给定 FLOPs ，当 $c_1=c_2$ 时，MAC 可取下界

Table1对上述进行验证，给定FLOPs，采用不同的通道比例，当 $c_1:c_2$ 越接近时，速度越快，与上述吻合
在这里插入图片描述

Group数量

分组卷积 $^{【1】}$ 可以减少参数和计算量，但是 FLOPs 降低并不意味着速度更快。将前面例子的 $1\times 1$ 卷积换成分组卷积，组数为 $g$ ，则该卷积层FLOPs为：
$B=hwc_1c_2/g$

所需存储空间只有卷积核减少了：
$\begin{aligned} \text {MAC}&=hw(c_1+c_2)+\frac{c_1c_2}{g}\\ &=hwc_1+\frac{Bg}{c_1}+\frac{B}{hw} \end{aligned}$

由上式可知：当 FLOPs 固定时，group 数量增加 $\text {MAC}$ 也随之增加

Table 2 将 FLOPs 固定， $c$ 为 $c_1$ 和 $c_2$ 之和，随着 group 数增加，为保持 FLOPs 基本不变， $c$ 也相应增加，但速度随之变慢，这与上述吻合

在这里插入图片描述

分支数量

下表中：2-fragment-series 表示一个block中有2个卷积层串行；2-fragment-parallel表示一个block中有2个卷积层并行。由此可知：支路多对于并行计算不利
在这里插入图片描述

Element-Wise操作

如下图所示：element-wise操作虽然FLOPs不大，但是时间消耗占比却不少，应当少用

在这里插入图片描述
ReLU、Add、AddBias等 element-wise 操作 FLOPs 小，但是 $\text {MAC}$ 大，如下表：取消 Relu 和 Short-cut层的 Add 后，速度有较大提升

ShuffleNet v2 Unit

由上述可知：设计高效网络应至少注意以下四点：

G1：输入输出通道数相等
G2：减少使用分组卷积
G3：减少分支数量
G4：减少element-wise操作

如下图所示：(a)、(b) 为 ShuffleNet v1 Unit：

Bottleneck 输入输出维度比例设计违反 G1
Group Convolutions违反 G2
使用过多的 Group 增加结构的碎片化违反 G3
在block最后的特征图（宽）上使用 element-wise Relu 和 Add 操作违反 G4

图(b)、(c) ShuffleNet v2 Unit 针对 ShuffleNet v1 Unit 改进：

Channel Split 操作为变相的Group操作，将输入特征分成两分支，一支为Short-cut，另一支则取消了 $1\times1$ 卷积中的Group操作，因此 Channel Shuffle 移到了最后
element-wise Add 操作替换为 concat，并取消了最后的 Relu

下表为 ShuffleNet v2 的整体架构：

在这里插入图片描述

实验

在这里插入图片描述

参考文献

【1】ShuffleNet v1
【2】MobileNets v1
【3】ShuffleNet v2算法笔记

xiaochengJF

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ShuffleNet v2

（ECCV 2018）
复制链接

扫一扫

专栏目录

ShuffleNet v2

文章目录

ShuffleNet v2设计原则

通道比例

Group数量

分支数量

Element-Wise操作

ShuffleNet v2 Unit

实验

参考文献

“相关推荐”对你有帮助么？