【模型压缩】模型剪枝详解

VIP文章 All_In_gzx_cc

于 2024-01-26 15:34:36 发布

阅读量1.1k

点赞数 16

分类专栏：【CV论文及数学原理】【pytorch】【AI模型训练与部署】文章标签：剪枝算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/All_In_gzx_cc/article/details/135865362

版权

参考链接：https://zhuanlan.zhihu.com/p/635454943
https

文章目录

1. 前言
- 1.1 为什么要进行模型剪枝
- 1.2 为什么可以进行模型剪枝
2. 剪枝方式的几种分类
3. 示例
- 3.1 Network Slimming

1. 前言

1.1 为什么要进行模型剪枝

CNN在实际应用中的部署主要受以下几个方面制约。

1）模型大小的限制

CNN强大的表示能力来自其数百万可训练参数。这些参数以及网络结构信息需要存储在磁盘上，并在推理期间加载到内存中。例如，在ImageNet上存储一个典型的CNN会消耗超过300MB的空间，这对嵌入式设备来说是一个巨大的资源负担。

2）运行时内存

在推理期间，CNN的中间激活/响应甚至可能比存储模型参数占用更多内存空间，即使批量大小为1。这对于高端GPU来说不是问题，但对于许多计算能力较低的应用程序来说，这是负担不起的。

3）计算操作数

卷积操作在高分辨率图像上计算量很大。大型CNN在移动设备上处理一张图像可能需要几分钟的时间，这使得在实际应用中采用它是不现实的。

因此有必要对模型进行压缩，而满足边缘设备的AI应用。

而剪枝就是模型压缩技术的一种。（模型压缩技术：剪枝、蒸馏、量化、低秩分解等）

1.2 为什么可以进行模型剪枝

生物学启发：

生物研究发现人脑是高度稀疏的。
比如 2016年早期经典的剪枝论文就曾提到，生理学上发现对于哺乳动物，婴儿期产生许多的突触连接，在后续的成长过程中，不怎么用的那些突触就会退化消失。突触修剪从出生时就开始了，一直持续到
20 多岁。
结合深度神经网络是模仿人类大脑结构，和该生理学现象，我们可以认为深度神经网络是存在稀疏性的。

过参数化：

深度学习网络模型从卷积层到全

最低0.47元/天解锁文章

关注

16
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
【模型压缩】模型剪枝详解

CNN在实际应用中的部署主要受以下几个方面制约。1）模型大小的限制CNN强大的表示能力来自其数百万可训练参数。这些参数以及网络结构信息需要存储在磁盘上，并在推理期间加载到内存中。例如，在ImageNet上存储一个典型的CNN会消耗超过300MB的空间，这对嵌入式设备来说是一个巨大的资源负担。2）运行时内存在推理期间，CNN的中间激活/响应甚至可能比存储模型参数占用更多内存空间，即使批量大小为1。这对于高端GPU来说不是问题，但对于许多计算能力较低的应用程序来说，这是负担不起的。3）计算操作数。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。