rknn支持的量化方式

最新推荐文章于 2024-08-15 11:08:48 发布

trainingVIP

最新推荐文章于 2024-08-15 11:08:48 发布

阅读量224

点赞数 2

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/trainingVIP/article/details/140779017

版权

以下作为笔记，部分来自GPT4o

1、非对称量化

asymmetric_quantized-u8

其中 Qx代表量化后的数，f 代表浮点数，s表示缩放系数（float32 类型）， z 代表实数为 0 时对应的量化值（int32 类型），最后把 quant 饱和到[range_min, range_max]，目前只支持 uint8 类型，所以 range_max 等于 255，range_min 等于 0 对应的反量化公式如下

公式：Qx=clamp(f/s +z , 0, 255)

2、动态定点量化

动态定点数的计算公式通常表示为Q格式，其中Qm.n表示具有m位整数部分和n位小数部分的定点数格式。对于 dynamic_fixed_point-i8 和 dynamic_fixed_point-i16，其计算公式可以如下表示：

dynamic_fixed_point-i8：

格式：Q7.1
计算公式：
- 数值范围：从 -128 到 +127，小数位数为1位。
- 具体转换公式：对于一个浮点数值 x，其定点数表示为 Q7.1格式的定点数 Qx,可以计算为： Qx=round(x*2^1)
- 其中， round 是四舍五入函数。在这种情况下，小数部分只有一位，因此乘以 2^1（即左移1位）后，结果被四舍五入到最接近的整数值。

dynamic_fixed_point-i16：

格式：Q15.1
计算公式：
- 数值范围：从 -32768 到 +32767，小数位数为1位。
- 具体转换公式：对于一个浮点数值 x，其定点数表示为 Q15.1,格式的定点数 Qx, 可以计算为： Qx=round(x*2^1)
- 在这种情况下，同样是乘以 2^1（即左移1位）后，结果被四舍五入到最接近的整数值。

注意事项：

这些公式中的 x是原始的浮点数值。
乘以 2^1实际上是左移1位，这是因为在定点数表示中，小数部分是通过固定点左移来实现的。
四舍五入确保了在浮点数转换为定点数时，尽可能地保留原始浮点数的数值精度。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

trainingVIP CSDN认证博客专家 CSDN认证企业博客

码龄5年

4: 原创

172万+: 周排名

16万+: 总排名

3521: 访问

: 等级

66: 积分

21: 粉丝

25: 获赞

3: 评论

28: 收藏

私信

关注

热门文章

最新评论

qwen-vl本地部署记录
雨轩.思邈: CUDA out of memory. Tried to allocate 24.00 MiB (GPU 0; 4.00 GiB total capacity; 2.75 GiB already allocated; 271.65 MiB free; 2.80 GiB allowed; 2.79 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF 哭了
linux使用sed批量替换多个文件指定内容
CSDN-Ada助手: 恭喜您再次发布了一篇关于linux使用sed批量替换多个文件指定内容的博客！您的技术文章总是能够帮助到很多读者，我非常期待您下一篇博客的发布。或许您可以考虑分享一些关于Linux系统的高级操作技巧或者实用的shell脚本编写经验，这些内容一定会受到很多读者的欢迎！期待您的下一篇精彩文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
ubuntu显卡驱动重启后失效的解决办法
CSDN-Ada助手: 恭喜你开始了博客创作，标题看起来很有技术含量！对于解决ubuntu显卡驱动重启后失效的问题提供了很好的解决办法，希望你能继续分享更多类似的技术经验和解决方案。或许下一步可以尝试写一些关于其他系统或软件的故障排除经验，让更多人受益。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
qwen-vl本地部署记录
CSDN-Ada助手: 非常棒的部署记录！希望看到更多关于Qwen-VL的分享和经验总结。除了记录部署过程，或许可以尝试深入研究Qwen-VL的架构设计、性能优化技巧，甚至尝试定制化开发一些功能模块，这样可以更全面地了解和应用Qwen-VL。期待你在博客中分享更多有关这方面的知识和经验！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。