PPQ量化框架

最新推荐文章于 2024-07-12 19:06:42 发布

kuzma_zhang

最新推荐文章于 2024-07-12 19:06:42 发布

阅读量719

点赞数 1

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kuzma_zhang/article/details/131438618

版权

一、量化的基本流程：

网络解析

在ppq/api/interface.py当中：

其中NetworkFramework是一个枚举类，表述各种网络类型，如果读取成功，返回一个BaseGraph（就是ppq里面的计算题），要想读取pytorch、TF的话需要将模型导出为ONNX

图调度

首先了解调度器，其中一个全新的调度器在ppq/scheduler/perseus.py,

其中一个函数dispatch说明了需要量化的：矩阵乘、卷积操作，不需要量化的：shape算子、Topk算子，把从矩阵乘/卷积计算节点出发的数据，其传递闭包（数据从哪里来，途径点），最后输出一个调度表

初始化量化信息：理解量化部署的核心。

要五个东西去量化模型，调度表、PPQ计算图、TargetPlatform（量化平台）、一堆数据、quantizationSetting（量化配置）

在文件ppq/api/interface.py，有很多类型的

其中的TargetPlatform：

其中的quantizationSetting是一个封装了量化配置参数的数据结构，你可以修改它的参数来自定义量化规则与优化方式,

如何去做初始化的呢？在ppq/quantization/quantizer/base.py里面，QuantizationSetting创建管线的，TargetPlatform选量化器

这个quantize（量化器）函数的职责就是负责根据调度情况，初始化算子的量化信息，并创建量化管线。做了有如下三步：

prequant pipeline:  启动预处理管线

quantize all operations  初始化量化信息

calling graph optimization pipeline  启动量化管线

量化信息是ppq中的一种数据结构：TensorQuantizationConfig，在ppq/core/quant.py里面

TQC描述量化的具体细节，量化器初始化了policy,num-of-bits,state,rounding,quant-min,quant-.max,其余属性交由量化管线进一步处理：scale、_offset、_dominator

在PPQ中，所有的量化计算都在ppq/quantization/qfunction/linear.py,量化器的子类将近20个

举例说明一个量化器：TRTQuantizer，在ppq/quantization/quantizer/下面

对呀trt平台，关闭所有输出量化，即

bias_config = OQC.input_quantization_config[-1]
bias_config.state = QuantizationStates.FP32

但是对于卷积、反卷积、矩阵乘等算子而言需要做per-channal，重新设定校准方式为minmax

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
PPQ量化框架

在ppq/api/interface.py当中：其中NetworkFramework是一个枚举类，表述各种网络类型，如果读取成功，返回一个BaseGraph（就是ppq里面的计算题），要想读取pytorch、TF的话需要将模型导出为ONNX。
复制链接

扫一扫

kuzma_zhang CSDN认证博客专家 CSDN认证企业博客

码龄3年

15: 原创

136万+: 周排名

32万+: 总排名

1万+: 访问

: 等级

158: 积分

2: 粉丝

5: 获赞

10: 评论

37: 收藏

私信

关注

热门文章

分类专栏

问题汇总 3篇

最新评论

TFlite安卓部署
qq_34321693: 大佬怎么修改yolov5s-fp16.tflite模型的输入输出维度？
WSL2搭建YOLO环境CUDA加速
CSDN-Ada助手: 恭喜您写了第7篇博客！标题“WSL2搭建YOLO环境CUDA加速”听起来非常有趣和实用。您的文章内容可能会对那些想要在WSL2环境中进行CUDA加速的读者非常有帮助。希望您能继续坚持创作，分享更多有关深度学习和计算机视觉的知识和经验。如果可能的话，下一步您可以考虑添加一些实例或案例研究，这样读者可以更好地理解和应用您所介绍的内容。期待您未来更多的博客！
笔记本连接主机的WSL2-ubuntu20.04
CSDN-Ada助手: 恭喜您写了第9篇博客！标题“笔记本连接主机的WSL2-ubantu20.04”听起来非常有趣。您对WSL2-ubantu20.04的连接方法进行了详细的介绍，这对许多读者来说一定非常有帮助。作为下一步的创作建议，我想提出一个小小的建议。或许您可以考虑扩展一下您的博客主题，比如介绍一些在WSL2-ubantu20.04上进行开发的实际案例，或者分享一些您在连接过程中遇到的挑战和解决方法。这样的内容会更加丰富您的博客，并吸引更多的读者前来探索。再次恭喜您的持续创作，期待您未来更多的精彩博文！
修改Linux防火墙状态
CSDN-Ada助手: 恭喜您写了第14篇博客！标题“修改Linux防火墙状态”听起来非常有趣。通过分享您的经验和知识，您不仅帮助了其他用户理解如何修改Linux防火墙状态，还为他们提供了一种保护系统安全的方法。我非常期待您下一篇博客的发布，也许您可以介绍一些高级的防火墙配置选项，或者与其他系统安全相关的主题。谢谢您的分享！
WSL libcuda.so.1 is not a symbolic link 的解决方法
CSDN-Ada助手: 恭喜您撰写了第10篇博客！标题中提到的解决方法对于解决WSL libcuda.so.1的问题非常有帮助。您的博客内容一直都很有深度，对读者来说非常有价值。如果可能的话，我建议您可以进一步探索其他常见问题的解决方法，或者分享一些实用技巧和经验。期待您未来更多的创作！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。