【论文笔记】Filter Pruning via Geometric Median for Deep Convolutional Networks Acceleration

最新推荐文章于 2024-04-16 10:14:52 发布

shura_R

最新推荐文章于 2024-04-16 10:14:52 发布

阅读量4k

点赞数 1

分类专栏：模型压缩文章标签：模型压缩通道剪枝深度学习几何中值

本文链接：https://blog.csdn.net/qq_30615903/article/details/102935644

版权

模型压缩专栏收录该内容

6 篇文章

订阅专栏

本文介绍了一种基于几何中心的模型压缩方法FPGM，该方法针对传统基于范数裁剪方式的局限性，通过裁剪靠近几何中心的冗余卷积核，实现了更有效的模型压缩效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文：https://arxiv.org/pdf/1811.00250.pdf
源码：https://github.com/he-y/filter-pruning-geometric-median

本篇论文来源于CVPR2019的oral，主要提出了一种基于几何中心剪枝的模型压缩方法，文章分析了基于范数阈值裁剪的局限性，提出了FPGM的裁剪方式，并经过实验验证证明了FPGM算法更加有效。

简介

在这篇论文中，指出了基于范数裁剪方式的弊端，经过试验分析作者发现基于番薯标准裁剪的效果，主要取决于两个隐含条件： 1）权重的标准差足够大 2）权重的最小的范数应该趋近于0。然而这两个条件并不能保证总是满足，为了解决这个问题文章提出了一种基于几何中心的裁剪方式，认为靠近几何中心的卷积核在划水，因此可以裁减掉这些冗余的卷积核。
在这里插入图片描述

contributions

1）分析了基于范数标准裁剪方式的局限性，两个条件需要被满足： 1）权重的标准差足够大 2）权重的最小的范数应该趋近于0
2）提出了几何中位数裁剪的FPGM方法，裁剪掉可替代的冗余的卷积核
3）经过试验证明FPGM真实有效

方法

分析基于范数的评价标准

在这里插入图片描述
Figure.2 中蓝色的是我们认为的范数分布情况，基于范数裁剪的方法在理想情况下能发挥作用，但是在真实环境下却是绿色的分布，因此说明传统的基于范数裁剪的方式具有一定的局限性。
作者预训练了一些模型，权重分布可视化效果图如下所示。
在这里插入图片描述

基于几何中心的评价标准FPGM

在这里插入图片描述
公式(1)为几何中心的计算法方式，假设在实数空间内存在n个点 $a^{(i)}$ $i \in [1, n]$ ，目标是求解在实数空间内找到到各个a点欧式距离最小的 $x$ ， $x^*$ 即为到各点距离和最小的几何中心

对应到本文问题上，我们当前层中的卷积核就是空间内的a点，因为用卷积核的符号替代，重新整理的后的几何中心求解公式即为公式(2) $x^{GM}$ 就是这些卷积核的几何中心
在这里插入图片描述
找到了几何中心后，顺利成章的我们就要开始找到距离几何中心最近的卷积核了，不难思考直接遍历每个卷积核，计算其与 $x^{GM}$ 的欧式距离，然后找到最小的即可。如公式(3)所示