简介 参考论文:https://arxiv.org/abs/2005.13297 OAQ (Overflow-aware Quantization)利用量化比特位宽的表示冗余,借助INT16单元寄存中间、与最终乘累加结果,在ARM平台上实现计算加速; 基本原理 文章基于TF-Lite的非对称量化训练算法,提出了INT16乘累加防溢出条件: 总体来说,要求整数的中间乘累加、与最终累积结果不能溢出INT16范围; 文章通过引入可调整的alpha因子,提出了整数量化范围的自适应调整机制: