009. 量化概念记录

1. 基础科普:

  • FP32可表示的数值范围为 -3.4 * 10^38 ~ 3.4 * 10^38。
  • INT8可表示的数值范围为 -128 ~ 127。(即8bit)
  • INT4可表示的数值范围为 -8 ~ 7。(即4bit)

2. 量化方法分类:

  • 精度分:8bit量化,4bit量化, 16bit量化。
  • 根据缩放系数能否覆盖网络数据和参数范围分:饱和量化(需要),非饱和量化。
  • 根据零点是否为0分:对称量化,非对称量化。
  • 按是否需要数据集和训练分:动态离线量化,静态离线量化,量化感知训练。(1)动态离线量化:无需样本数据,对模型的参数在推理前进行量化。该方法依赖最少,量化的效果一般,量化的加速效果弱一些。(2)静态离线量化:在预测前使用量化校准集进行模型激活值分布的统计,确定激活层的量化参数。(3)量化感知训练:在训练的过程中网络模拟量化的效果进行参数更新和优化,量化的效果最好,部署预测无速度损失,训练过程需要进行改变。

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值