CNN模型压缩方案

最新推荐文章于 2024-08-21 11:27:28 发布

平凡的兵

最新推荐文章于 2024-08-21 11:27:28 发布

阅读量1.9k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chinabing/article/details/77117145

版权

机器学习专栏收录该内容

23 篇文章 0 订阅

订阅专栏

本文探讨了CNN模型压缩的重要工作，包括SqueezeNet的FireModule设计，通过1x1和3x3卷积减少参数量，以及MobileNet提出的Depth-wise Separate Convolution，利用分组卷积和1x1卷积实现高效轻量化。这些方法在保持模型性能的同时显著降低了计算复杂度。

摘要由CSDN通过智能技术生成

本文主要总结近年来CNN的模型压缩方案

第一个代表性的工作是在2016年SqueezeNet，这篇文章中，作者总结模型设计三个原则

–(1)使用1*1网络代替3*3网络

•替换3x3的卷积kernel为1x1的卷积kernel可以让参数缩小9X为了不影响识别精度，并不是全部替换，而是一部分用3x3，一部分用1x1

•如何用1x1和3x3组合替换3x3？ Fire modules

–(2)减少3*3滤波器的输入通道数

•一层卷积层参数量

#inputChannel * #outputChannel * #filters * (3*3)

–(3)降采样层移到网络的后端

延迟降采样有助于保留信息，提升性能

FireModule是本文的核心构件，思想非常简单，就是将原来简单的一层conv层变成两层：squeeze层+expand层，各自带上Relu激活层。在squeeze层里面全是1x1的卷积kernel，数量记为S1x1；在expand层里面有1x1和3x3的卷积kernel，数量分别记为E1x1和E3x3，要求S1x1< input map number即满足上面的设计原则（2）。expand层之后将1x1和3x3的卷积outputfeature maps在channel维度拼接起来。

三个超参数：s(1x1):squeeze层的1*1滤波器个数；e(1x1):expand层的1*1滤波器个数；e(3x3):expand层的3*3滤波器个数；

第二个代表性的工作是2017年的MobileNet，提出Depth-wise separate convolution的结构(下图b和c)，以此代替传统的convolution(下图a),如下图所示。

图b其实是group-wise convolution的一种特例，M个输入通道就有M个group，每个group只有一个channel或者说一张图。

然后再采用1x1卷积将M个group合并。

参数量变换(a-->bc)：M*N*Dk*Dk --> M*1*1*Dk*Dk + M*N*1*1

最后，贴上face++总结的CNN结构演化路径

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。