量化方法总结(1)

本文介绍了量化模型的不同方面,包括post training quantization与quantization aware training的对比,以及二值化、三值化和bit-shifts等精度分类。还讨论了量化映射的两种情况和梯度更新策略,同时指出大部分工作在处理bn时的局限性。
摘要由CSDN通过智能技术生成

量化模型的特征

从training和inference模型是否一致来看,可细分为:

  • post training quantization。在训练时不做quantization,inference时将所有需要quantization的地方做量化。这种做法往往对accuracy损失较大
  • quantization aware training。 在训练时做quantization,但对quantization的地方要同时保留原有精度,以便于梯度更新。在inference时只保留量化后的结果。这种做法效果往往要好于第一种。
  • training与inference时模型一致。这种做法目前只见过一例(WAGE)。需要保证梯度更新时能直接更新在量化后的weights上。

从quantization的精度来看,可细分为:

  • 二值化
  • 三值化
  • bit-shifts。用两个整数来记录任何一种精度。其中一个整数是 2 n 2^{n} 2n的指数位,另一个是扩大 2 n 2^{n} 2n倍的浮点数的整数位Int。然后用 I n t 2 n \frac {Int}{2^{n}} 2nInt来表征任何一种精度

从quantization的映射情况看,可细分为:

  • 映射后与映射前相对大小关系不变。映射前a>b,映射后:q(a)>q(b)。这里a
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值