本篇主要介绍网络剪枝可以极大改善量化损失
如有错误和不当之处,望指教!
根据我自己工作遇到的海思量化精度问题,以及如何改善和提升精度,整理记录而成。
网络剪枝的好处是啥?
1:在保持精度的条件下,可以降低运算量和参数量【毕竟端侧设备推理性能是在有限】
- 从下图可以看出,不同的prune-ratio,精度都还可以
- flops可以降低1/3,params可以降低1/2
- 如果好好在调参,应该可以进一步剪枝
2:可以减少量化损失
数据:我司自有的活体ir数据
网络:mobilenet-v2
部署:Hisi -DV300
精度:compile_mode = High-precision(FP16)