【论文分享】A White Paper on Neural Network Quantization【3】PTQ部分

本文大部分是翻译,就算是翻译读下来也很吃力,建议粗读。我自己会更关注💡部分,可以细读一下。

3. PTQ训练后量化(离线量化)

训练后量化算法将预先训练好的FP32网络直接转换成定点网络,不需要原始训练pipeline。
离线量化可以是无数据的,或者可能需要一个现成的小校准集。几乎不需要超参数调优,可以直接用单独的API作为黑盒方法,以计算效率高的方式量化预训练的神经网络,让神经网络量化更广泛的应用。

PTQ过程中的一个基本步骤是为每个量化器找到良好的量化范围。 在2.2节中简要讨论了量化范围的选择如何影响量化误差。在本节有如下几个内容:

  • 首先,讨论在实践中用于寻找好的量化参数的各种常用方法。
  • 然后,探讨在PTQ期间观察到的常见问题,并介绍克服这些问题的最成功的技术。使用这些技术,提出了一个标准的训练后量化pipeline,发现它在大多数常见场景中工作得最好。
  • 最后,引入了一组调试步骤,以提高量化模型的性能。

3.1 设置量化范围

在网络量化过程中,变量 x x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zoetu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值