pytorch模型compression-prune,sparsity,quantization

最新推荐文章于 2024-07-24 10:58:27 发布

大尾巴狼的觉悟

最新推荐文章于 2024-07-24 10:58:27 发布

阅读量632

点赞数 1

分类专栏：人工智能文章标签： compression prune spasity quantization

本文链接：https://blog.csdn.net/qq_43518599/article/details/102959898

版权

技术同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

人工智能

4 篇文章 0 订阅

订阅专栏

pytorch模型compression-prune,sparsity,quantization

sparsity

sparsity

Pruning individual weight elements is called element-wise pruning, and it is also sometimes referred to as fine-grained pruning

在这里插入图片描述

Filter Pruner

相连卷积层变换
Filter Pruner
conv + bn + conv 变换
在这里插入图片描述
non-serial data-dependencies

element-wise-summed and fed into a third Convolution

channel pruner

在这里插入图片描述

mobile_net quantization 实验数据

图片大小 27 x 33 pixel

model	size	top1(accuracy)	inference time
未量化模型	9.2M	99.1	7.46 ms(cpu) / 4.85 ms(gpu)
量化后模型	3.1M	98.9	1.75 ms(gpu)
半精度模型	4.7M	99.1	5.28 ms(gpu)

图片大小 136 x 91 pixel

model	size	top1(accuracy)	inference time
未量化模型	9.2M	99.1	16 ms(cpu) / 4.83 ms(gpu)
量化后模型	3.1M	98.9	5.99 ms(gpu)
半精度模型	4.7M	99.1	5.13 ms(gpu)

图片大小 620 x 827 pixel

model	size	top1(accuracy)	inference time
未量化模型	9.2M	99.1	480 ms(cpu) / 21.2 ms(gpu)
量化后模型	3.1M	98.9	123 ms(gpu)
半精度模型	4.7M	99.1	17.6 ms(gpu)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大尾巴狼的觉悟

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

使用Python和PyTorch实现深度学习中的模型压缩

程序员光剑

07-15

2006

作者：禅与计算机程序设计艺术随着深度学习的普及和应用的广泛化，深度神经网络(DNN)模型越来越复杂，训练耗费的计算资源也越来越多。如何有效地减少模型的参数量、降低计算成本并提升模型准确率成为当下研究热点。近年来，针对模型压缩（Model Compression）的研究工作逐渐火起来，尤其是通过剪枝、量化、蒸馏等方式对DNN进行压缩的方法

神经架构搜索与模型压缩：实现高效的模型部署

程序员光剑

12-31

871

神经架构搜索（Neural Architecture Search, NAS）和模型压缩（Model Compression）是两个在深度学习领域中越来越受到关注的研究方向。NAS 涉及到自动地搜索和优化神经网络的结构，以提高模型性能。模型压缩则关注将大型神经网络压缩为更小的模型，以实现高效的模型部署。在过去的几年里，深度学习已经取得了巨大的成功，在图像识别、自然语言处理等领域取得了显著的进展。然而，这些成功也带来了挑战。首先，训练大型神经网络需要大量的计算资源和时间。

参与评论您还未登录，请先登录后发表或查看评论

CompressAI：基于pytorch的图像压缩框架使用

小夭的博客

07-12

7360

CompressAI: a PyTorch library and evaluation platform forend-to-end compression research，我的理解是一个基于图像（视频）压缩的API库。他是建立在 PyTorch 之上的，用于基于深度学习的数据压缩的自定义操作、层和模型，其中包括了基于tensorflow.compression压缩包的部分移植，还包括包括一些用于压缩任务的预训练模型。其中可以直接用到的模型来自以下几篇文献：同时提供了与原作者实验对比的测试数据的性能

使用torch_pruning对YOLOv8进行剪枝（新版、detect、segment）

最新发布

yoletPig的博客

07-24

909

在结构修剪中，**Group被定义为深度网络中最小的可移除单元。**每个组由多个相互依赖的层组成，需要同时修剪这些层以保持最终结构的完整性。然而，深度网络通常表现出层与层之间错综复杂的依赖关系，这对结构修剪提出了重大挑战。这项研究通过引入DepGraph轻松实现参数分组，并有助于修剪各种深度网络。如修剪图中高亮的神经元，我们需要对所有有连线的层都进行修剪。

pytorch prune剪支教程

qq_47150350的博客

06-26

1650

为了使剪枝成为永久的，我们可以移除weight_orig和weight_mask的重新参数化，并移除forward_pre_hook，我们可以使用torch.nn.utils.prune中的remove功能。例如，假设您想要实现一种剪枝技术，它会剪枝张量中的每个其他条目（或者如果张量之前已经被剪枝，则剪枝剩余未剪枝部分的张量）。函数的第一个参数是模块，name使用字符串标识符在该模块中标识参数，amount指示要剪枝的连接的百分比（如果是0到1之间的浮点数），或要剪枝的连接的绝对数量（如果是非负整数）。

pytorch自带网络_Pytorch网络压缩系列教程一:Prune你的模型

weixin_39747334的博客

10-27

418

Pytorch网络压缩系列教程一:Prune你的模型本文由林大佬原创，转载请注明出处，来自腾讯、阿里等一线AI算法工程师组成的QQ交流群欢迎你的加入: 1037662480 深度学习模型取得了前所未有的巨大成功, 并且引领着新的科技潮流. 但学术界流传的深度学习模型, 通常都是超参数化的, 在更低功耗, 便携式的设备上部署时, 会遇到很多问题. 为了将我们的模型进一步压缩, 同时保证模型具有和以前...

pytorchpruner

05-16

pytorchpruner 执行python setup.py install进行安装。检查notebooks/是否有样品。 pytorchpruner是用于修剪神经网络的软件包。它旨在用于研究，其主要目标不是提供最快的修剪框架，但是它相对有效且快速。它使用掩盖思想来模拟修剪，并支持两种主要的修剪策略。它还实现了各种二阶函数，例如粗麻布和粗麻布矢量乘积。该库有X个主要部分参数修剪（pytorchpruner.scorers）：显着性度量为提供的参数张量中的每个参数返回相同大小的分数张量。单位修剪（pytorchpruner.unitscorers）：显着性度量，可在提供的参数张量中返回每个单位的分数矢量。修剪器（pytorchpruner.pruners）：对于两个不同的修剪策略（参数与单位），具有两个不同的修剪器引擎。如果可能，此文件中的remove_e

优化PyTorch模型:加速与减少计算成本

AI架构设计之禅

02-22

938

PyTorch 是一个基于 Torch 库的 Python Package，提供 Tensor computation with strong GPU acceleration and deep neural networks built on a tape-based autograd system. 简单来说，PyTorch 是一个开源的机器学习库，支持 GPU 加速，提供了动态计算图和反向传播算法，广泛应用于深度学习领域。更好的模型压缩技术。

模型压缩算法国内外研究现状综述

Joejwu的博客

07-03

1852

剪枝类型参考文章评估指标简介参数驱动[99][100][101][102]基于权值的L1/L2范数[103][104][105]基于BN层的γ参数[106][107]基于BN层的γ参数衍生的缩放因子[108]基于卷积核的谱聚类[109]基于卷积核的几何中位数[110]基于卷积核的相似度数据驱动[111]基于后一层的统计信息[112][113][114]基于激活值最小重构误差[115]基于剪枝前后特征图熵值大小[116]

模型压缩(Model compression)

starlight1231的博客

02-06

926

模型压缩

Deep Compression/Acceleration（模型压缩加速总结）

Mars_WH的专栏

12-07

3317

模型压缩论文目录结构`structure`量化`quantization`Binarized Neural Networks: Training Deep Neural Networks with Weights and Activations Constrained to +1 or -1FINN: A Framework for Fast, Scalable Binarized Neural ...

pytorch自带的模型剪枝工具prune的使用

pangxing6491的博客

06-09

921

https://blog.csdn.net/zhou_438/article/details/109053992

【pytorch】模型剪枝 model pruning

学渣的博客

04-09

797

torch.nn.utils.prune 是pytorch用于修剪模型的工具包，其通过修改将模型某一层的参数进行限定，然后再使用 prune.remove 函数进行修剪，一般来说，修剪参数值较小的参数，模型的性能也不会发生太大变化。但是要注意，本文介绍的都是非结构剪枝，就是哪些被裁剪为0的参数，在经过模型重新训练以后，会重新进行迭代更新，对于结构剪枝，使用本文的方法不适用，建议采用 github 上面的一些库来进行实现。

pytorch pruning训练自己的数据库（流程+BUG调试）

qq_23225921的博客

12-16

3804

环境要求pytorch 0.1 ，pytorch0.2版本会有问题，解决方法会在后文介绍。本文主要对运行pytorch pruning的整个流程以及过程中会出现的问题的介绍。

【PyTorch单点知识】神经元网络模型剪枝prune模块介绍（下，结构化剪枝）

m0_49963403的博客

06-24

866

PyTorch剪枝模块prune介绍（结构化剪枝部分）

【PyTorch单点知识】神经元网络模型剪枝prune模块介绍（上，非结构化剪枝）

m0_49963403的博客

06-24

2973

PyTorch剪枝模块prune介绍（上，非结构化剪枝部分）

pytorch如何使用自带的模型剪枝工具prune

weixin_48304306的博客

09-22

4185

pytorch剪枝工具prune的用法。

基于pytorch的模型压缩和模型剪枝Model Prune示例