《Soft Filter Pruning for Accelerating Deep Convolutional Neural Networks》论文笔记

最新推荐文章于 2023-06-13 10:53:32 发布

m_buddy

最新推荐文章于 2023-06-13 10:53:32 发布

阅读量2.4k

点赞数 1

分类专栏：模型压缩&加速文章标签： filter pruning

本文链接：https://blog.csdn.net/m_buddy/article/details/85346684

版权

本文介绍了SFP（Soft Filter Pruning）算法，一种在训练过程中逐步剪枝并保留模型容量的方法，减少了对预训练模型的依赖。通过在每个epoch后根据Lp-norm度量标准剪枝，SFP在ResNet-101上实现了42%的计算量减少，同时提高了2%的top-5准确率。相较于传统硬剪枝，SFP保持了网络的表达能力和精度，实验表明L2-norm优于L1-norm。

摘要由CSDN通过智能技术生成

1. 概述

这篇文章中给出了一种叫作SFP（Soft Filter Pruning），它具有如下两点优点：
1）Larger model capacity。相比直接剪裁掉网络中的filters，再在这个基础上finetune，这篇论文中的方法将其保留，这为优化网络的表达以及任务能力提供了更多空间。
2）Less dependence on the pretrained model，采用上述的方法可使网络连续剪枝和重新练，可以从网络的训练开始就进行剪枝，不需要再训练好一个模型之后再剪枝，节省了很多时间。
使用论文中的方法使得ResNet-101节省了42%的计算量，而且top-5的错误率还获得了2%的提升！
论文地址：Soft Filter Pruning for Accelerating Deep Convolutional Neural Networks
代码地址：soft-filter-pruning
在下面一幅图中比较了论文中给出的SFP算法与传统剪枝算法（Hard Filter Pruning）的比较。
在这里插入图片描述
传统减值方法中filters被删除掉了就不会继续回到网络中参与训练，需要预训练模型，剪枝之后再fintune去逼近原来的状态。这样的结构限制了网络的表达能力。相反论文中提出的方法是在训练的时候边剪枝边训练，一个epoch之后对模型剪枝，剪除的filters其内部权值全部被置为0，然后下一个epoch训练。如此往复得到最后的模型。这样做的好处是剪枝不是不可恢复的操作，网络的表达能力并没有被减小且精度得到了保障，同时网络被剪裁。

2. SFP算法

2.1 算法整体流程

下图是算法的整体流程：
在这里插入图片描述
在上图中对 $k$ 次epoch进行剪枝，检测的策略是根据 $L_p-norm$ 进行度量，之后剪除比较小的权重（也就是filters置为0）。之后再在下一个epoch中进行迭代。

2.2 算法具体步骤

对于CNN网络中的卷积参数可以使用 $W^{(i)}$ 来表示，其为 $W^{(i)}\in R^{N_{i+1}*N_i*k*k}$ ，代表第 $i$ 个卷积层的卷积参数矩阵， $N_i$ 代表第 $i$ 个卷积的feature map数量， $k$ 代表卷积核的尺寸。那么对应的第 $i$ 层的feature map为 $U$ ，空间尺度为

最低0.47元/天解锁文章

m_buddy

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
《Soft Filter Pruning for Accelerating Deep Convolutional Neural Networks》论文笔记

1. 概述这篇文章中给出了一种叫作SFP（Soft Filter Pruning），它具有如下两点优点：1）Larger model capacity。相比直接剪裁掉网络中的filters，再在这个基础上finetune，这篇论文中的方法将其保留，这为优化网络的表达以及任务能力提供了更多空间。2）Less dependence on the pretrained model，采用上述的方法可...
复制链接

扫一扫

专栏目录