模型裁剪与压缩

最新推荐文章于 2024-07-18 17:17:27 发布

天马行空的神经质少女

最新推荐文章于 2024-07-18 17:17:27 发布

阅读量364

点赞数 1

分类专栏：基础知识文章标签：模型优化

基础知识专栏收录该内容

6 篇文章 0 订阅

订阅专栏

如何压缩模型大小与优化加速？

模型裁剪

严格意义上的剪枝，是将不重要的节点权重，激活值清0，而不是删除。其结果只是将模型稀疏化，所以，如果没有指定特定的稀疏矩阵加速库，那么剪枝的加速效果是不明显的。可以对权重，偏置，激活值进行剪枝，但是，偏置对一层的贡献较大，所以，不好对偏置做稀疏化。权重一般是接近0的很小的数，实际上压缩意义也不大（这个看需求，可以将不重要的权重置0，依情况而定），剪枝主要是对Relu类的激活值进行稀疏化，因为其输出具有大概率0值（也要注意，如果激活函数不是这种分布的输出，那么压缩也不明显）。

剪枝，需要剪枝准则，通常可以针对每个节点，卷积核，通道，块，调整其稀疏度，然后测试结果，看其对性能的影响，这样，就可以生成敏感性分析报告，从而确定每个节点，卷积核，通道，块的敏感度阈值。这里的稀疏度，用L0范数来定义。

加速网络设计

mobile net v2 论文认为一个高效的CNN应该包含以下四点：
1.使用平衡的卷积，即输入通道数=输出通道数
2.意识到分组卷积带来的计算消耗
3.减少网络分支
4.减少element-wise操作（relu / add tensor)

shuffleNet:
shuffle net
(a)(b)是shuffleNet v1 的结构图 ©(d)是shuffleNet v2的结构图
©中包含了channel split操作，在这里已经进行通道分组，故相比shuffleNet v1 两个1*1卷积不再是分组卷积，满足G2。两个分支用concat操作进行合并，使得输入输出通道数相等，这满足了G1。合并后，紧接着使用了channel shuffle操作。
这样的block已经没有add和relu操作，同时depthwise卷积只在一个分支里。