【图像分类】ShuffleNet: 一个极端高效的移动端卷积神经网络

最新推荐文章于 2024-09-06 18:06:59 发布

行路南

最新推荐文章于 2024-09-06 18:06:59 发布

阅读量1k

点赞数

分类专栏：图像分类文章标签：神经网络图像分类移动端卷积神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010414589/article/details/117023576

版权

ShuffleNet是旷视科技2017年提出的高效移动端卷积神经网络，采用逐点组卷积降低计算复杂度，并通过通道混洗改善信息流动，以在保持准确率的同时减少计算成本。实验表明，ShuffleNet在ImageNet和MS COCO等竞赛中表现出优于其他移动端网络的性能。

摘要由CSDN通过智能技术生成

码字不易，欢迎点赞。文章同步发布在公众号：CV前沿

在上一篇文章中，我们已经介绍了一种针对移动端和嵌入式设备的卷积神经网络—-MobileNet。今天我们要介绍的是旷视科技在2017年12月份提出的更加高效的移动端卷积神经网络—-ShuffleNet。

在ShuffleNet网络中使用了两个创新的操作：

pointwise group convolution（逐点组卷积）
channle shuffle（通道混洗）

概要来说，逐点组卷积是降低了逐点卷积（也即是1*1卷积）的计算复杂度；同时为了消除多个组卷积堆叠产生的副作用，采用通道混洗的操作来改善跨特征通道的信息流动。使得ShuffleNet网络在保持准确率的情况下，极大的降低了计算成本。ShuffleNet网络在ImageNet竞赛和MS COCO竞赛中均表现了比其他移动端先进网络更优越的性能。

逐点组卷积

我们在文章中介绍移动端不同类型的卷积操作时，其中讲到了普通卷积、组卷积和逐点组卷积这几个概念。

这里再简单回顾一下，组卷积是在输入特征图的通道方向执行分组；逐点组卷积本只是组卷积的一种特殊形式，特殊的地方在于它的卷积核的核大小为1*1。如下图所示。

在这里插入图片描述

那么为什么ShuffleNet网络要使用逐点组卷积呢？

这要从ResNext讲起。

我们知道，ResNext就是对ResNet的残差单元进行了微创新,创新点就是组卷积，从而提升了网络的精度。ResNet和ResNext的残差单元如下所示。

在这里插入图片描述

ResNet unit 结构图

在这里插入图片描述

ResNext unit 结构图

但对于ResNext的一个残差单元来说，逐点卷积(1*1卷积)占整个残差单元计算量的93.4%，可见逐点卷积的计算成本是很高的。那么在小型网络中，为了符合移动端设备上有限的计算资源，代价昂贵的逐点卷积会导致网络整体变窄（每层通道数变少），进而可能带来精度的大幅度下降。

总结来说，由于逐点卷积的昂贵的计算开销，使得网络在满足设备计算资源情况下，无法满足精度需求。从而这种网络结构不适应于移动端和嵌入式设备。

为了解决这个问题，本文提出了逐点组卷积。逐点组卷积的特点是通过保证每个卷积操作仅仅是作用在对应的输入通道组，使得大大减少了计算量。

我们根据对组卷积的知识，假设组个数为 $g$ , 那么逐点组卷积相对于逐点卷积，计算量下降了 $g$ 倍。

但是，如果多个组卷积堆叠在一起，会产生一个副作用：某个通道的输出结果，仅来自于一小部分输入通道。如下图图（a）。

这个副作用会导致在组与组之间信息流动的阻塞，以及表达能力的弱化。

那么我们如何解决这个问题呢？这用到了本文的第二个创新—通道混洗。

通道混洗

在这里插入图片描述

如图所示。通过对比图（a）和图（b），我们在第一个逐点组卷积之后，对输出的结果的通道次序进行打乱，比如原始在通道维度上的索引是0，1，2，3，4，5，6，7，8；那么打乱后变为了0，3，6，1，4，7，2，5，8。

经过这样打乱之后，输出通道就不再仅仅来自于是一小部分输入通道，也会来自其他的通道。即输出通道和输入通道完全的关联了。形成的效果如图（c）所示。

通道混洗的操作实现了多组卷积层的跨组信息流动。

ShuffleNet Unit

利用逐点组卷积和通道打乱的操作，我们可以建立一个针对于小型网络特别设计的ShuffleNet unit。

在这里插入图片描述

最初设计是一个残差块（residual block）如图（a）所示。

然后在（a）的残差分支中，对于其中的3 * 3卷积层，我们应用一个计算成本低的3 * 3 的DW卷积。

然后我们替换了第一个逐点卷积，改为逐点组卷积，后面跟一个通道混洗操作。如图（b）所示。

图（b）中的第二个逐点组卷积的目的是为了恢复输出通道数量（升维），从而和输入通道数量一致，以便能够实现与捷径分支的输出结果进行相加操作。（相加要求两个分支的特征图在宽度、高度和深度均一致）

这就形成了一个完整的ShuffleNet unit了。

此外，我们知道卷积神经网络都需要有降采样操作，一种实现方式是采用最大池化层，另一种做法是使用stride=2的卷积来实现。

在ShuffleNet unit中，同样是采用的stride=2的卷积。如图（c）所示。具体做法是分别在捷径分支的分支设置stride=2和主分支的3*3 DW卷积中设置stride=2，从而既能够实现降采样的操作，同时又能够实现两个分支输出结果的融合。

这里还需要注意的两点是：

捷径分支上它采样的是3 * 3的平均池化。
融合没有采用相加的方法，而是通道方向的拼接。文中介绍到这样是为了更容易以很少的计算量来扩大通道维度。

与ResNet,ResNext计算量的对比

假设输入特征图形状是 $c * h * w$ ,以及bottleneck 模块的通道数是m，那么三个网络的残差单元的计算量分别是：

ResNet unit:

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

行路南 CSDN认证博客专家 CSDN认证企业博客

码龄12年

129: 原创

3万+: 周排名

168万+: 总排名

114万+: 访问

: 等级

5760: 积分

426: 粉丝

617: 获赞

255: 评论

3037: 收藏

私信

关注

热门文章

分类专栏

OpenCV 3篇
C++
语义分割 6篇
图像分类 5篇
数据集 3篇
NVIDIA DeepStream 9篇
LeetCode 8篇
目标检测 4篇
数据增强 1篇
PyTorch 2篇
deep learning 4篇
目标追踪 2篇
自然语言处理 2篇
知识图谱 6篇
matplotlib 1篇
Git 1篇
机器学习 19篇
数据挖掘 22篇
算法 7篇
学习随笔 15篇
Hadoop 8篇
Linux 4篇
软件部署 17篇

最新评论

【PyTorch】torch.mean(), dim=0, dim=1 详解
lanlalala: a tensor([[[ 0., 1., 2., 3.], [ 4., 5., 6., 7.], [ 8., 9., 10., 11.]], [[12., 13., 14., 15.], [16., 17., 18., 19.], [20., 21., 22., 23.]]], dtype=torch.float64) a.shape torch.Size([2, 3, 4]) mean0 tensor([[[ 6., 7., 8., 9.], [10., 11., 12., 13.], [14., 15., 16., 17.]]], dtype=torch.float64) mean0.shape torch.Size([1, 3, 4]) mean1 tensor([[[ 4., 5., 6., 7.]], [[16., 17., 18., 19.]]], dtype=torch.float64) mean1.shape torch.Size([2, 1, 4]) mean2 tensor([[[ 1.5000], [ 5.5000], [ 9.5000]], [[13.5000], [17.5000], [21.5000]]], dtype=torch.float64) mean2.shape torch.Size([2, 3, 1])
【PyTorch】torch.mean(), dim=0, dim=1 详解
lanlalala: 按照楼主的，可供参考 a = torch.arange(24, dtype=float).reshape((2,3,4)) print('a',a) print('a.shape', a.shape) print(" ") mean0 = torch.mean(a, dim=0, keepdims=True) print('mean0', mean0) print('mean0.shape', mean0.shape) print(" ") mean1 = torch.mean(a, dim=1, keepdims=True) print('mean1', mean1) print('mean1.shape', mean1.shape) print(" ") mean2 = torch.mean(a, dim=2, keepdims=True) print('mean2', mean2) print('mean2.shape', mean2.shape)
7G的森林火情数据集，文末附数据集和源代码
qq_56413072: 博主，求一份数据集有没有百度网盘链接
7G的森林火情数据集，文末附数据集和源代码
weixin_43880420: 博主，这个数据集有标注文件嘛？
二叉树的后序遍历
小白 ~forever: 你这页面设计有点离谱，锚点链接不用，用新页面

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。