重训练量化（改进QAT）

最新推荐文章于 2025-02-28 20:13:33 发布

hey-yahei

最新推荐文章于 2025-02-28 20:13:33 发布

阅读量2k

点赞数 1

文章标签：人工智能机器学习深度学习模型压缩量化

本文链接：https://blog.csdn.net/qq_20759449/article/details/108717591

版权

本文探讨了在深度学习模型压缩中，如何改进Quantize Aware Training（QAT）。通过Alpha-Blending（AB）、QuantNoise和全精度辅助模块等方法，减少对Straight-Through Estimator（STE）的依赖，提高低精度模型训练的稳定性和精度。AB算法通过权重混合避免使用STE，QuantNoise随机量化部分权重，全精度辅助模块则利用全精度分支增强梯度来源，从而改善量化模型的训练效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文链接：https://www.yuque.com/yahei/hey-yahei/quantization-retrain_improved_qat
欢迎引用&转载，但烦请注明出处~

Quantize Aware Training(QAT)通过在训练过程中融入量化和反量化过程，来实现量化模型的精度恢复，但考虑一下量化过程
![image.png](https://img-blog.csdnimg.cn/img_convert/a86094a7396694cbba5791bd488c0b63.png#align=left&display=inline&height=254&margin=[object Object]&name=image.png&originHeight=329&originWidth=215&size=23595&status=done&style=none&width=166)
$w_q = q(w) = \alpha \cdot Clamp(Round(\frac{w}{\alpha}))$
$\frac{\partial L}{\partial w} = \frac{\partial L}{\partial w_q} \cdot \frac{\partial w_q}{\partial w} \mathop{\approx} \limits_{STE} \frac{\partial L}{\partial w_q} \cdot 1 = \frac{\partial L}{\partial w_q}$