深度神经网络模型压缩方法总结

最新推荐文章于 2023-05-04 17:43:22 发布

小胖蹄儿

最新推荐文章于 2023-05-04 17:43:22 发布

阅读量5.4k

点赞数

分类专栏： Deep Learning

本文链接：https://blog.csdn.net/Cheese_pop/article/details/79544981

版权

本文总结了深度神经网络的模型压缩方法，包括新型卷积计算如SqueezeNet、MobileNets和ShuffleNet，以及对已训练模型进行裁剪的策略。SqueezeNet通过1x1卷积减少参数，MobileNets利用深度可分离卷积提高效率，ShuffleNet结合深度可分离卷积和通道混洗。此外，介绍的模型裁剪方法涉及剪枝、权值共享、量化和二值化等技术，旨在实现模型减小和效率提升。

摘要由CSDN通过智能技术生成

新的卷积计算方法

这种是直接提出新的卷积计算方式，从而减少参数，达到压缩模型的效果，例如SqueezedNet,mobileNet

1. SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size

代码地址：https://github.com/DeepScale/SqueezeNet
下图是论文中的Fire Module，将上一层的输出分别输入到1*1的卷积核3*3的卷积层中。
这里写图片描述
使用以下三个策略来减少SqueezeNet参数：
（1）使用1∗1卷积代替3∗3 卷积：卷积模板的选择，从12年的AlexNet模型一路发展到2015年底Deep Residual Learning模型，基本上卷积大小都选择在3x3了，因为其有效性，以及设计简洁性。本文替换3x3的卷积kernel为1x1的卷积kernel可以让参数缩小9X。但是为了不影响识别精度，并不是全部替换，而是一部分用3x3，一部分用1x1。
（2）减少输入3x3卷积的input feature map数量：这一部分使用squeeze layers来实现。参数量=通道数*filter数*卷积窗口，因此减少feature map的输入数量就可以一定程度上的减少参数量。
（3）将欠采样操作延后，可以给卷积层提供更大的激活图：更大的激活图保留了更多的信息，可以提供更高的分类准确率。在具体实现时，只在卷积第1、4、8层做了max pooling，在conv10做了全局平均pooling
其中，（1）和（2）可以显著减少参数数量，（3）可以在参数数量受限的情况下提高准确率。
另外论文中还使用了global average pooling代替全连接层的策略来进一步减少参数量（关于GAP要复习一下NIN）。