卷积神经网络通道剪枝裁剪

最新推荐文章于 2024-01-26 15:34:36 发布

huang_nansen

最新推荐文章于 2024-01-26 15:34:36 发布

阅读量1.6w

点赞数 5

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huang_nansen/article/details/84668607

版权

深度学习专栏收录该内容

23 篇文章 3 订阅

订阅专栏

论文来自旷视科技2017年的论文Channel Pruning for Accelerating Very Deep Neural Network

论文地址：https://arxiv.org/abs/1707.06168

代码地址：https://github.com/yihui-he/channel-pruning（还没跑过）

卷积通道剪枝

论文的主要思想是，通过最小化裁剪后特征图和裁剪前特征图之间的误差，尽可能的减少卷积核的通道数。

图1

图1中B、W和C分别为输入特征图、卷积核和输出特征图。c和n为输入特征图的通道数和输出特征图的通道数。

在卷积计算中，我们使用im2col来表示输入特征图、卷积核以及输出特征图，分别为：

$(H*W)*(C_{in}*k_{h}*k_{w})$ 的输入特征图， $(C_{in}*k_{h}*k_{w})*(C_{out})$ 的卷积核， $(H*W)*(C_{out})$ 的输出特征图。

其中H和W分别为输出特征图的高和宽。

由矩阵乘法可知，卷积核中对应的行只和输入特征图矩阵中特定的列相乘，如图1所示，当我们裁剪了卷积核中的通道数后，相对应的输入特征图中的通道数亦可裁去，而输出当前输入特征图的对应上层的卷积核亦可裁去。

如何选取裁剪的通道，是本文的重点。

公式1中的Y为原始输出特征图，而后半部为裁剪后的输出特征图。我们将两者之间的距离作为误差，目的就是在尽可能剪枝的情况下，保持剪枝后特征图和原始特征图的差距最小。式中beta为0时，对应的输入层失效，达到剪枝的效果。公式中的限制项为beta的0范数，c'为一个超参数，表示我们希望剪枝的最小剪枝数。由于优化一个带0范数的损失函数是一个NP难问题，作者引入lasso来代替原始损失函数，尽可能的使beta向量稀疏。

优化过程可以分为两步：

1. 固定W参数，迭代的方法，使beta向量尽可能稀疏，达到预先设定的剪枝数。

2. 固定迭代好的beta，输入X变为X'，X'即为beta迭代后与原始输入X的乘积。

多通道网络卷积通道剪枝

对于多通道网络，例如ResNet中的残差块，作者提出了一种解决方法。

block的输入

上图左中可知，残差块的输入和shortcut是相同的，若对残差块中第一个卷积操作进行剪枝，会影响到shortcut，因此作者提出了在残差块输入后添加一层sampler，进行通道采样，避免残差块中第一层卷积的剪枝对shortcut的影响。

block的输出

对于输出，原始残差块中，shortcut和残差块输出是相同通道数的，若对最后一层1x1卷积剪枝，会影响到残差块输出Y2和shortcut的Y1的组合。因此作者提出，最后一层卷积层拟合的特征图，从原始的输出特征图Y2，变为Y1-Y1'+Y2，Y1为未裁剪的残差块输入特征图，Y1'为残差块之前卷积裁剪后的特征图，Y2为残差块未裁剪的输出特征图。

这篇论文提出的通道裁剪在对指标影响较小的情况下，极大的提升了网络的性能。

在VGG中，达到4倍的速度情况下，仅仅增加了1%的top-5误差。

ResNet达到2倍速度的情况下，增加了1.4%的误差。

Faster-RCNN在达到2倍速度的情况下，仅降低了0.4mAP。

关注

5
点赞
踩
51

收藏

觉得还不错? 一键收藏
3
评论
卷积神经网络通道剪枝裁剪

论文来自旷视科技2017年的论文Channel Pruning for Accelerating Very Deep Neural Network论文地址：https://arxiv.org/abs/1707.06168代码地址：https://github.com/yihui-he/channel-pruning（还没跑过）卷积通道剪枝论文的主要思想是，通过最小化裁剪后特征...
复制链接

扫一扫

专栏目录

huang_nansen CSDN认证博客专家 CSDN认证企业博客

码龄8年

38: 原创

31万+: 周排名

137万+: 总排名

17万+: 访问

: 等级

1537: 积分

53: 粉丝

108: 获赞

43: 评论

517: 收藏

私信

关注

热门文章

分类专栏

pytorch 1篇
Python 1篇
docker 1篇
java 2篇
LeedCode 2篇
深度学习 23篇
opencv 5篇
剑指offer 1篇
计算机视觉 20篇
AI 5篇

最新评论

【opencv】HSV颜色值对照表
病妖: 有问题吧，当s在30-43时是什么颜色？
OpenCV简单标准数字识别
清风拂山岗853: 博主，可以求一下代码吗，谢谢你。[email protected] 谢谢
【Tensorflow】Tensorflow训练过程中使用边缘提取
gaoxiangshuai: pytorch怎么在训练过程中有没有办法提取边缘啊，试了把tensor转numpy格式再提取边缘，梯度就消失了
【Tensorflow】Tensorflow checkpoint导入导出pb文件
RX3: 你好，请问导出PB模型3，4行的input_tensor和output_tensor分别是什么ne
OpenCV简单标准数字识别
阿尔卑微795: 这是没索引到图片吧，看下路径对不对

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。