【量化】——LSQ算法原理理解

最新推荐文章于 2024-08-16 15:15:22 发布

农夫山泉2号

最新推荐文章于 2024-08-16 15:15:22 发布

阅读量6.4k

点赞数 1

分类专栏：量化/剪枝文章标签：机器学习 python 人工智能

原文链接：https://zhuanlan.zhihu.com/p/406891271

版权

量化/剪枝专栏收录该内容

12 篇文章

订阅专栏

本文深入探讨了神经网络量化技术，包括Fakequantize和Learned Step Size Quantization (LSQ)。Fakequantize通过选择合适的scale将浮点权重转换为低比特整数。而在LSQ中，scale作为学习参数，通过训练获得。量化过程包括前向的量化和反量化，反向传播时使用Straight-Through Estimator (STE)。LSQ的scale更新考虑了权重和scale之间的关系，并在反向传播时引入因子g。尽管量化使卷积层变为整数，但如何与BN层融合仍是一个问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文主要内容转载自:https://zhuanlan.zhihu.com/p/406891271
尊重原创，请看原文
参考理解的code：QuantLib

1. Fakequantize

选取合适的scale将float的 weight tensor 转换成低比特的整型数据。一般后量化的算法都是通过找合适的scale

量化：
$q=round( clip(r_i / scale, Q_{min}, Q_{max}) )$

反量化：
$r_o = q \times scale$

量化 scale：
$scale = (R_{max} - R_{min} ) / (Q_{max} - Q_{min} )$

其中：r表示浮点数，q表示低比特的整型数，scale是浮点和整型之间的缩放因子。

2. LSQ

LSQ中tensor的量化过程和伪量化一样，而其核心：scale不是通过tensor计算而来，而是将其作为一个可学习参数，通过训练得来

LSQ的量化，反量化公式和上面一样：
在这里插入图片描述
其中： $Q_N,Q_P$ 是量化后整型数的最小，最大值。 $v$ 是原始浮点数, $\hat{v}$ 是反量化回来的浮点数。s就是上面提到的 scale 。

将上面图片中的公式1，2合并得到：
在这里插入图片描述
训练时，前向 $v->\hat{v}$ 会对tensor进行量化，反量化操作，就是上图的公式。

$\hat{v}$ 对 $v, s$ 的倒数为：

$\frac{\delta \hat{v}}{\delta v} = v, -Q_N<v<Q_P$
在这里插入图片描述
上面的 $\frac {\delta round(v/s)} {\delta s}$ ，采用STE方式求导，为：

另外，作者还认为，scale的更新要与权重的更新有一个相似的关系，所以对于scale需要做一个处理，即在前向传播的时候不做处理，在反向传播的时候引入一个因子g,具体的处理过程如下所示。
在这里插入图片描述
g

其中： $g=\sqrt {tensor.numel() / Q_P}$ ，这就是在tensor和scale之间引入的相关性变量。

scale的初值，论文中为： $\times <|v|> / \sqrt {Q_p}$ ，其中的 $< ∣∣ >$ 表示一种运算，一般为max，mean。

最后，总的损失L对scale的前向和反向为：
在这里插入图片描述

这就是整个核心部分的原理，包括前向和反向。

3. 疑问

conv量化之后，是能变成整数，但是怎么和bn层融合呢？

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。