本篇文章只对weight做了量化,且是三值量化。
量化目标:
量化方式:
对于
Δ
∗
\Delta^{*}
Δ∗的取值,文章给出了下面的解释
总之就是正态分布约为0.6
σ
\sigma
σ,标准分布为
1
3
a
\frac {1}{3}a
31a.
trainning 和inference的操作:
采用了train-aware quantization。
在inference的时候再把全精度的weights去掉,只保留量化后的部分。