pytorch深度学习入门（15）之-使用onnx模型量化

码农呆呆

已于 2023-11-30 11:11:41 修改

阅读量757

点赞数 6

分类专栏：深度学习文章标签：人工智能 pytorch 深度学习 python 神经网络

于 2023-11-17 17:45:07 首次发布

本文链接：https://blog.csdn.net/ajunbin859/article/details/134467977

版权

本文介绍了PyTorch中ONNX模型的量化过程，包括量化概述、ONNX量化表示格式和量化模型的方法。动态量化和静态量化各有优缺点，适用于不同的模型类型。此外，文章还讨论了数据类型选择、量化操作支持和GPU上的量化，并解答了关于性能改进和量化方法选择的常见问题。

摘要由CSDN通过智能技术生成

量化 ONNX 模型

内容

量化概述

ONNX 运行时中的量化是指 ONNX 模型的 8 位线性量化。

在量化期间，浮点值被映射到以下形式的 8 位量化空间：val_fp32 = scale * (val_quantized - zero_point)

scale是一个正实数，用于将浮点数映射到量化空间。计算方法如下：

对于非对称量化：

<span style="background-color:#f5f6fa"><span style="background-color:#f5f6fa"><span style="color:#5c5962"><span style="background-color:#f5f6fa"><span style="color:#5c5962"><code> scale = (data_range_max - data_range_min) / (quantization_range_max - quantization_range_min)
</code></span></span></span></span></span>

对于对称量化：

<span style="background-color:#f5f6fa"><span style="background-color:#f5f6fa"><span style="color:#5c5962"><span style="background-color:#f5f6fa"><span style="color:#5c5962"><code> scale = max(abs(data_range_max), abs(data_range_min)) * 2 / (quantization_range_max - quantization_range_min)
</code></span></span></span></span></span>

zero_point表示量化空间中的零。浮点零值在量化空间中能够精确表示是很重要的。这是因为许多 CNN 中都使用了零填充。如果量化后无法唯一表示0，就会导致精度误差。

ONNX 量化表示格式

有两种表示量化 ONNX 模型的方法：

面向操作员（QOperator）。所有量化运算符都有自己的 ONNX 定义，例如 QLinearConv、MatMulI

最低0.47元/天解锁文章

码农呆呆

关注

6
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
pytorch深度学习入门（15）之-使用onnx模型量化

让我们使用 U8U8 作为 (activations ：uint8，权重：uint8），U8S8（激活：uint8，权重：int8），类似地S8U8和S8S8用于其余两种格式。该问题的解决方案是将原始计算图的权重和激活张量与量化图的权重和激活张量进行比较，确定它们最大的不同之处，并避免量化这些张量，或者选择另一种量化/校准方法。动态量化和静态量化之间的主要区别在于如何计算激活的尺度和零点。然而，量化过程中的模型优化给调试过程带来了困难，因为它可能会显着改变计算图，导致量化模型与原始模型截然不同。
复制链接

扫一扫