Notes on Deep Compression

最新推荐文章于 2022-12-23 15:05:02 发布

shikch

最新推荐文章于 2022-12-23 15:05:02 发布

阅读量337

点赞数

分类专栏：深度学习论文阅读

本文链接：https://blog.csdn.net/shikch/article/details/51872963

版权

深度学习论文阅读专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最近看了一篇文章，对神经网络进行压缩。方法简单并且十分有效。《Deep Compression: Compressing Deep Neural Networks with Pruning Trained Quantization and Huffman Coding》

文章讨论了深度神经网络的压缩。通过剪枝、量化和哈夫曼编码三个步骤将模型文件的大小压缩了35x-49x。

I. 剪枝

1.将所有小于阈值的链接从网络中删去

2.重新训练整个网络

3.存储稀疏的权值

diff表示与上一个稀疏元素位置之差。由于只用3个bit来编码diff，所以如果两个稀疏元素间隔超过8，就补上一个diff为8的0值权值。最终存储的是黄色高亮的部分。

II. 量化

1.同一范围内的权重分成一组，用一个数代替，组成centriods。

2.对应的每组的所有梯度相加，从centroids上减去

3.分组方式为 k-means clustering，即将n个权值W = {w1, w2, ..., wn} 分成 k 组 C = {c1, c2, ..., ck}，并且使得：

III. 哈夫曼编码

由于网络中参数的分布是有偏的，可以通过哈夫曼编码的方式，用更短的码来表示出现更频繁的值。具体方法学过通信原理的都知道，网上也有很多资料，在此不再赘述。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

shikch

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

A Survey on Deep Learning Techniques Applied to medical image analysis

程序员光剑

08-13

269

作者：禅与计算机程序设计艺术 Introduction:Deep learning techniques have recently gained popularity in medical image analysis because they are capable of accurately identifying disease markers without relying on human intervention, enabling better decision-making and tre

【论文解读】如何让CNN高效地在移动端运行

SIGAI_CSDN的博客

02-22

2152

参与评论您还未登录，请先登录后发表或查看评论

神经网络压缩：Deep Compression

shuzfan的专栏

05-12

1万+

本次介绍的方法为“深度压缩”，文章来源与2016ICLR最佳论文《Deep Compression: Compression Deep Neural Networks With Pruning, Trained Quantization And Huffman CodingIntroduction神经网络功能强大。但是，其巨大的存储和计算代价也使得其实用性特别是在移动设备上的应用受到了很大限制。所

DEEP COMPRESSION

Ryn_love的博客

08-19

428

神经网络是计算密集型和内存密集型的，这使得它们很难部署在硬件资源有限的嵌入式系统上。修剪、训练量化和霍夫曼编码，它们一起工作，在不影响其准确性的情况下，将神经网络的存储需求减少35倍至49倍。我们的方法首先通过只学习重要的连接来修剪网络。然后对权重进行量化，实现权重共享，最后采用Huffman编码。在前两步之后，我们重新训练网络来微调剩余的连接和量子化的质心。剪枝，减少连接数9到13；然后量化将表示每个连接的比特数从32减少到5。

Compression Deep Neural Networks With Pruning, Trained Quantization And Huffman Coding

Focusing on your own Mind :) －> 站在巨人的肩膀上

06-14

1957

本次介绍的方法为“深度压缩”，文章来自2016ICLR最佳论文《Deep Compression: Compression Deep Neural Networks With Pruning, Trained Quantization And Huffman Coding 转自:http://blog.csdn.net/shuzfan/article/details/51383809 (内含多

深度压缩-Deep Compression

J_Boom的博客

02-26

1239

Deep Compression 方法，包含裁剪，量化，编码三个手段。模型参数分析：网络中全连层参数和卷积层weight占绝大多数，卷积层的bias只占极小部分。而参数分布在0附近，近似高斯分布。参数压缩针对卷积层的weight和全连层参数。每一层的参数单独压缩。 1. 剪枝(pruning) 模型的裁剪方法则比较简单明了，直接在原有的模型上剔除掉不重要的filter，虽...

神经网络压缩--Deep Compression

weixin_45963617的博客

07-11

224

Introduction 神经网络功能强大。但是，其巨大的存储和计算代价也使得其实用性特别是在移动设备上的应用受到了很大限制。所以，本文的目标就是：降低大型神经网络其存储和计算消耗，使得其可以在移动设备上得以运行，即要实现 “深度压缩”。实现的过程主要有三步：（1）通过移除不重要的连接来对网络进行剪枝；（2）对权重进行量化，使得许多连接共享同一权重，并且只需要存储码本(有效的权重)和索引；（3）进行霍夫曼编码以利用有效权重的有偏分布；具体如下图： Network Pruning “剪枝”

【李宏毅2020 ML/DL】P51 Network Compression - Knowledge Distillation | 知识蒸馏两大流派

记录学习痕迹的公众号：Piper蛋窝

08-01

1332

详细讨论了知识蒸馏，包括 Logits Distillation 与 Feature Distillation 两大流派。

计算机视觉学习资料汇总（超多干货）

qq_29462849的博客

12-21

3848

前言本资料首发于公众号【3D视觉工坊】，更多干货请关注公众号后台回复关键字获取~ （一）基础操作 Linux 学习网站 Linux中国：https://linux.cn/ 鸟哥的linux私房菜：http://linux.vbird.org/ Linux公社： https://www.linuxidc.com/ 学习书籍《鸟哥的Linux私房菜》《Linux命令行与shell脚本编程大全》 ...

【论文阅读笔记】NeurIPS2020文章列表Part1

热门推荐

zincrain的博客

12-09

2万+

压缩鼻祖Deep Compression_剪枝_

10-04

深度学习网络压缩技术剪枝论文鼻祖，注意，这是一篇论文，这是一篇论文

DeepCompression-PyTorch:学习有效的神经网络的权重和连接https

05-02

一个PyTorch执行。要运行，请尝试： python train.py --model= ' resnet34 ' --checkpoint= ' resnet34 ' python prune.py --model= ' resnet34 ' --checkpoint= ' resnet34 ' 概括给定一个ResNets系列，我们可以构建精度和参数数量之间折衷的Pareto边界： Han等。假设我们可以通过保持网络结构固定但删除单个参数来击败Pareto前沿：

DeepCompression:神经网络迭代修剪的实现[Han2015]

04-30

的实现，仅在mnist上有效。谢谢用法迭代修剪 cd mnist_iterative_pruning python iterative_prune.py -1 -2 -3 这将在mnist上训练卷积模型。然后在fc层上修剪并重新训练20次。最后，fc层将转换为稀疏格式并保存。表现我们拥有相当不错的修剪性能，将精度保持在0.987，而在fc层中修剪了99.77％的权重。保持重量比准确性 1个 0.99 0.7 0.991 0.49 0.993 0.24 0.994 0.117 0.993 0.057 0.994 0.013 0.993 0.009 0.992 0.0047 0.99 0.0023 0.987 0.0016 0.889 0.0011 0.886 0.00079 0.677 0.00056 0.409 就

深度网络压缩文献/代码列表-Awesome Deep Neural Network Compression.zip

12-16

深度网络压缩文献/代码列表-Awesome Deep Neural Network Compression.zip 【深度网络压缩文献/代码列表】’Awesome Deep Neural Network Compression - Summary, Code for Deep Neural Network Quantization' by Chen Shangyu

模型压缩：Deep Compression

人工智能技术学习与分享

01-22

6422

第一步weight pruning 第二步trained quantization and weight sharing 第三步 Huffman coding 实验分析之压缩几十倍从何而来实验分析之极致量化《Deep Compression Compressing Deep Neural Networks with Pruning, Trained Quantization

【神经网络压缩】Deep Compression ( ICLR 2016 best paper)

weixin_41977410的博客

10-10

1184

主题：对2016年ICLR最佳论文进行初步解读原因：希望能够在这个方向上想到合适的idea，有共同爱好或者有想法的朋友可以私信我。一起脱发一起科研，不出意外的话接下来应该还有会找同类的论文进行比对思考，有推荐同类型经典高引用文献可推荐给我谢谢。内容：对一篇讲神经网络的压缩的论文进行整理。后续能不能搞成系列就随缘论文链接：https://arxiv.org/pdf/1510.00149....

[论文解读] Deep Compression

博观而约取，深研而广求

09-16

808

基本介绍《Deep Compression : Compressing Deep Neural Networks With Pruning, Trained Quantization and Huffman Coding》是ICLR16的best paper，其核心的想法是在不损失模型精度的情况下，将ALexNet， VGG-16等普遍使用的模型进行压缩，使此类模型移植到微型嵌入式或者移动设备成

论文理解--DEEP COMPRESSION

t765833631的博客

12-23

1091

结论：大权值比小权值影响力更大，但是同时它们的数量更少，因此在Forgy和density-based方法中，非常少的中心位于大权值处，因此不能很好的代表大权值。实验思路：用不同的bit位表示中心，并使用3.2小节提到的三种初始化中心的方法linear、density，forgy。数据集的特征值在SVD中用奇异值来表征，按照重要性排列，降维过程就是舍弃不重要的特征向量的过程，而剩下的特征向量组成的空间即为降维后的空间。根据字符出现的概率性成熟表，出现概率越高的字符，需要越短的编码来表示。

Deep-compression 阅读笔记

JACK_YOUNG007的博客

04-30

347

参考链接1 参考链接2参考链接3 参考链接4 参考链接5 参考链接6 引言--Why 模型压缩一直是机器学习的一个重要方向，并且一个模型不可能只在GPU和服务器上运行才可以。只有通过硬件化实现才能落地。但是神经网络也是非常耗费存储和耗费运算的。LeNet-5是一个简单的手写数字识别网络，AlexNet和VGG-16则用于图像分类，刷新了ImageNet竞赛的成绩，但是就其模型尺寸来...

deep compression