剪枝论文总结（二）

最新推荐文章于 2023-04-11 23:20:05 发布

Mr_tianyanxiaobai

最新推荐文章于 2023-04-11 23:20:05 发布

阅读量462

点赞数

分类专栏：人工智能文章标签：深度学习

本文链接：https://blog.csdn.net/Mr_tianyanxiaobai/article/details/109721371

版权

人工智能专栏收录该内容

24 篇文章 1 订阅

订阅专栏

Gate Decorator: Global Filter Pruning Method for Accelerating Deep Convolutional Neural Networks

本文方法

Gate Decorator

提出背景
简单的说，过滤器剪枝就是选择一个过滤器集合 $k \in K$ ，删除这些过滤器集合所对应的参数 $\theta^-$ ，剩下模型参数 $\theta^+$ 。则模型的目标函数如下：
在这里插入图片描述
传统的思路：循环 K 次，假设删除该次所对应的滤波器，计算损失差，如下：
得到所有损失差中最小的那个，该损失差对应的滤波器为 least effect of pruning。但是传统方法对于成千上万个滤波器的效率是很低的。为此，作者提出了 Gate Decorator 的方法用于 评估过滤器的重要性。

具体方法：

Gate Decorator 的意思就是为过滤器所输出的特征图 $z$ 赋予一个 Gate: $\phi$ 。即现在的特征图输出为：
$\hat{z}=\phi z$
当 $\phi=0$ 时，等价于修剪该过滤器。如果利用 $Ω$ 表示上面的 X,Y以及模型中除却 $\phi$ 的其他参数，那么整个模型的目标函数，可以化为如下形式：
在这里插入图片描述
对 $L_Ω^0$ 进行泰勒展开如下：

由于 R1 是一个拉格朗日余数，因此可以对这个余数进行省略。
综上，得到目标函数如下：

也就是说，我们可以将上面的目标函数作为每个过滤器的重要性评分，将上面公式还原，得到重要性评分 $\theta(\phi_i)$ :
在这里插入图片描述
最后，利用上面的重要性评分和 Batch Normalization 相结合（GBN），得到式子如下：

$z_{in}$ 为 BN 的输入数据（线性转换后的数据）， $r\hat{z}+\beta$ 为 BN 的输出数据，将 BN 后的数据，放入本论文的评分系统中，得到该过滤器的评分。

Tick-Tock Pruning Framework

一种简单的迭代的修剪结构
在这里插入图片描述
即 ResNet 的每一个模块的卷积都会在后面跟一个 GBN 层用于剪枝该层卷积中的过滤器。
注意：Tick-Tock 阶段是独立于训练阶段的，每次epoch在一个小的训练子集上进行，只更新 $\phi$ 值和最后一层网络层的参数，用于避免过拟合。

实验结果

比较剪枝方法之间的比较（on CIFAR-10）：
在这里插入图片描述

在数据 IMageNet上的比较
“[Top-1] ↓” and “[Top-5] ↓”：表示准确率下降的点数
“P .Top-1” and “P .Top-5”：表示剪枝的精度
在这里插入图片描述

总结

本文提出了三个组件来服务于全局过滤器修剪的目的
1)解决全局过滤器重要性排序(GFIR)问题的Gate Decorator算法。
2)提升修剪精度的 Tick-Tock 框架。
3)解决约束剪枝问题的群体剪枝方法。
我们证明了全局过滤剪枝方法可以看作是一种任务驱动的网络结构搜索算法。大量实验表明，该方法优于现有的几种过滤器剪枝方法。

Mr_tianyanxiaobai

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
剪枝论文总结（二）

Gate Decorator: Global Filter Pruning Method for Accelerating Deep Convolutional Neural Networks相关背景过滤器的修建不会改变模型的设计理念且易于和其他压缩，加速技术结合。不需要专门的硬件和软件进行加速。过滤器修建的研究可以主要分为两类：逐层修建和全局修建。由于每层网络需要预定义修建率，对于深度卷积，逐层修剪会非常耗时。全局修建只需要个一个修建率就可以对整个网络结构进行修改，但是全局修剪必须解决全局过滤器重
复制链接

扫一扫