神经网络量化------深刻解读Google 8bits量
本文参考论文为:Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference
有助于理解的代码可参考:google_quantization (代码中包含conv,relu、BN的量化,但可能缺少对全连接、pool的量化)
本文参考论文为:Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference
有助于理解的代码可参考:google_quantization (代码中包含conv,relu、BN的量化,但可能缺少对全连接、pool的量化)