【论文分享】A White Paper on Neural Network Quantization【3】PTQ部分

zoetu

已于 2022-09-16 11:51:14 修改

阅读量1.5k

点赞数

分类专栏：论文阅读深度学习模型压缩文章标签：机器学习深度学习算法

于 2022-09-16 11:36:52 首次发布

本文链接：https://blog.csdn.net/qq_43800119/article/details/125485064

版权

深度学习模型压缩同时被 2 个专栏收录

14 篇文章 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

论文阅读

29 篇文章

订阅专栏

本文深入探讨了神经网络的训练后量化（PTQ）技术，包括量化范围设置的不同方法，如Min-max、MSE和Cross entropy，以及Cross-Layer Equalization、Bias correction和AdaRound等优化策略。实验表明，这些方法在减少量化误差和提高模型性能方面具有显著效果，特别是在低比特量化中。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文目录

3. PTQ训练后量化（离线量化）

3.1 设置量化范围

Min-max

Mean squared error (MSE)

Cross entropy

BN base ranage setting

对比：权重量化的范围设置方法💡

3.2 Cross-Layer Equalization（CLE）

Absorbing high biases

实验💡

3.3 Bias correction

经验偏差校正

分析偏差校正

实验💡

3.4 AdaRound（自适应取整）💡

3.5 标准的PTQ流程(Standard PTQ pipeline) 💡

3.6 实验

3.7 调试 💡

系列文章索引

参考资料