对称量化（1）

Crazy learner

于 2024-08-07 08:20:49 发布

阅读量261

点赞数 8

分类专栏：模型量化文章标签：模型量化

本文链接：https://blog.csdn.net/weixin_52734695/article/details/140966258

版权

模型量化专栏收录该内容

4 篇文章 0 订阅

订阅专栏

步骤解析

数据类型范围：

int8：表示范围为-128到127之间的整数。
uint8：表示范围为0到255之间的整数。

示例浮点数：3.1415926
量化过程
计算线性映射的缩放值 (Scale)：
在这里插入图片描述
量化操作：

在二进制中表示为：01111111
反量化操作：

Python代码示例

import numpy as np

# 浮点数
float_num = 3.1415926

# int8的最大值
int8_max = 127

# 计算缩放值
scale = float_num / int8_max

# 量化操作
quantized_value = np.round(float_num / scale).astype(np.int8)

# 反量化操作
dequantized_value = quantized_value * scale

print("缩放值 (Scale):", scale)
print("量化值 (Quantized):", quantized_value)
print("反量化值 (Dequantized):", dequantized_value)

示例浮点数组：

[−0.75,−0.45,1.75]
量化步骤
1、计算缩放值 (Scale)：
在这里插入图片描述
2、量化操作：

3、裁剪 (Clipping)：
将量化值限制在int8范围内：

[−128,127]结果为[−77,−46,127]

4、反量化操作：
在这里插入图片描述
[−77,−46,127] 对应的反量化值为：[−0.754901,−0.450980,1.245098]

遇到的问题
反量化后的值不精确，如 1.245098 与原始 1.75 差异较大。
可能的解决方案：
最大绝对值对称量化：使得正负范围对称。
偏移修正：在量化过程中考虑偏移值。
Python代码示例

import numpy as np

# 浮点数数组
float_array = np.array([-0.75, -0.45, 1.75])

# int8范围
quant_min, quant_max = -128, 127

# 计算缩放值
float_min, float_max = float_array.min(), float_array.max()
scale = (float_max - float_min) / (quant_max - quant_min)

# 量化操作
quantized_values = np.round(float_array / scale).astype(np.int8)

# 裁剪量化值到范围内
clipped_values = np.clip(quantized_values, quant_min, quant_max)

# 反量化操作
dequantized_values = clipped_values * scale

print("缩放值 (Scale):", scale)
print("量化值 (Quantized):", quantized_values)
print("裁剪后的量化值 (Clipped):", clipped_values)
print("反量化值 (Dequantized):", dequantized_values)

Crazy learner

关注

8
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
对称量化（1）

−77,−46,127] 对应的反量化值为：[−0.754901,−0.450980,1.245098]反量化后的值不精确，如 1.245098 与原始 1.75 差异较大。[−128,127]结果为[−77,−46,127]int8：表示范围为-128到127之间的整数。uint8：表示范围为0到255之间的整数。最大绝对值对称量化：使得正负范围对称。在二进制中表示为：01111111。偏移修正：在量化过程中考虑偏移值。示例浮点数：3.1415926。Python代码示例。Python代码示例。
复制链接

扫一扫

专栏目录