SOPHON SDK进行int8模型量化过程中出现的常见问题

算能开发者社区

已于 2022-08-18 10:57:45 修改

阅读量734

点赞数

分类专栏： SOPHON SDK常见问题文章标签：人工智能

于 2022-08-10 18:01:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lily_19861986/article/details/126271524

版权

SOPHON SDK进行int8模型量化过程中出现的常见问题

1. int8的输出和fp32模型输出差异比较大怎么办？
2. 如何提高模型的量化效率和精度
3. 可以使用已有的量化表（比如 TensorRT 量化后得到的量化表）作为输入来完成BModel模型的量化吗？
4. 一键量化会不会遍历KL、MAX这些量化策略，策略的细节有哪些？
5. 手动指定量化参数时，需要尝试18种量化方法的组合，并逐个测试精度。1) 需要根据模型结构缩小量化方法的搜索范围，并提供相关量化参数的说明及推荐使用方法。2) 同时这些量化方法对量化后模型的性能有影响吗？
6. 量化策略里的MAX方法是指min-max吗？

1. int8的输出和fp32模型输出差异比较大怎么办？

检查前后处理是否有问题，是否遗漏int8网络输入输出的scale处理。
通过量化可视化工具分析int8的输出和fp32的输出的精度差异，做个输出曲线对比；通过曲线查找出导致误差较大的层，通过更换该层的量化方式调整结果，找到最优量化方式，若仍然不能满足精度要求，则可将该层设置为float输出，不进行量化。

2. 如何提高模型的量化效率和精度

对于检测和分类模型，使用自动量化工具，量化成功后精度测试；
对于其他类模型，手动指定量化参数，量化成功后精度测试；
自动量化失败或精度不够的，反馈给我们的技术支持。

3. 可以使用已有的量化表（比如 TensorRT 量化后得到的量化表）作为输入来完成BModel模型的量化吗？

目前不支持，前端转换成umodel之后网络的layer的名字对不上。

4. 一键量化会不会遍历KL、MAX这些量化策略，策略的细节有哪些？

autocalib会遍历所有量化策略，循环进行量化和测试精度的过程，叠加每次进行多次 iteration 的推理，选优提高量化精度。目前搜索策略有：
请添加图片描述
comb_list: [post_process_use_fp32，0]，[first_conv_compute_by_fp32，1]，[first_conv_enableper_channel，1]，-accuracy_opt=true，1]，[per_channel=t rue，1]，[-thmethod=SYMKL，1]，[-th_methodsD，1]，[-thmethod=MAX&#

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。