深度学习中的量化学习与量化训练
量化(quantized),即将神经网络前向过程中浮点数运算量化为整数运算,以达到计算加速的目的。通常是指将float32转化为int8进行运算,经实践部署dsp上能提升2.5~3倍左右的推理速度。我们知道对浮点数的量化操作是将其从一个高维度映射到低维度的转换过程。
参考文章见:
量化训练:Quantization Aware Training in Tensorflow(一)
量化训练:Quantization Aware Training (二)
大约就是下图这样,数据会集中到非常狭窄 (-127,12
原创
2020-12-02 20:01:44 ·
3962 阅读 ·
0 评论