量化的编码-解码（量化过程中最核心的矛盾：零点值既要保留，又要在计算时被消除）

Jaxuy

已于 2025-03-23 11:06:16 修改

阅读量938

点赞数 25

文章标签：硬件工程 RISC-V FPGA 量化

于 2025-03-21 17:58:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_65337711/article/details/146425821

版权

一、量化的编码-解码：零点值的双重身份

1. 编码阶段（量化）

零点值作为标尺零点：将浮点数的0精确映射到整数范围（例如INT8的128），相当于建立了一个新的坐标系。
，这里的z是浮点0的整数化身，确保量化后0的真实性。

2. 解码阶段（反量化）

零点值作为还原基准：计算完成后，需通过零点值将整数结果恢复为浮点值
，减去零点值是为了解除量化阶段的坐标系偏移，还原到原始浮点空间。

二、计算时为何必须暂时减去零点值？

1. 数学本质：消除系统偏移

量化后的整数是偏移数：若直接使用 $^{_{}}$ $x_{int}$ 计算，所有数值都叠加了z的偏移，导致计算结果整体偏离。例如: $(x+z)\cdot \left ( y+z \right )=xy+xz+yz+y^{2}$ ,将会引入交叉项和二次项误差。

2. 硬件计算的优化需求

避免冗余计算：在计算前减去零点值，可将所有操作统一到无偏移的坐标系中，使乘加运算的硬件电路无需处理额外的偏移补偿逻辑。

三、减去零点值后如何保证精度？

1. 计算流程分析：

首先，输入预处理： ${x{_{int}}}'=x{_{int}}-z$
其次，开始硬件计算： $y_{int}=Convolution({x_{int}}',{w_{int}}')$
最后，结果还原： $y_{float}=\left ( {y{_{int}}}'+z \right )*s_{}$

2. 数值稳定性分析：

输出零点值会重新引入偏移，确保最终结果与浮点模型对齐。
所有中间计算均在无偏移空间进行，避免了偏移量的逐层放大。

总结：矛盾背后的统一

编码时：零点值是浮点0的守护者，确保量化不扭曲基准。
计算时：零点值是误差的隔离墙，通过暂时消除自身，保证计算的纯粹性。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。