量化感知训练_pytorch量化备忘录

最新推荐文章于 2024-08-23 09:14:28 发布

weixin_39613433

最新推荐文章于 2024-08-23 09:14:28 发布

阅读量1.2k

点赞数 1

文章标签：量化感知训练

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39613433/article/details/111705275

版权

本文介绍了量化的基本概念，包括为什么要做量化、量化的好处和缺点。重点讲解了PyTorch中的量化步骤、量化方式，如Post Training Dynamic/Static Quantization和Quantization Aware Training，并详细阐述了后训练量化的过程，包括模型准备、模块融合、量化算法选择、observer插入、校准以及模块转化。最后讨论了量化模型的使用方法。

摘要由CSDN通过智能技术生成

什么是量化？

将高精度运算转化到低精度上运算，例如float32转化为int8数据上运算。

为什么要量化？

那就要说说量化的好处了，一般量化有以下好处：

减小模型尺寸和存储空间，如int8量化可减少75%的模型大小；
加快推理速度，访问一次32位浮点型可以访问四次int8型，运算更快；
减少设备功耗，内存耗用少了推理速度快了自然减少了设备功耗；
支持微处理器，有些微处理器属于8位的，低功耗运行浮点运算速度慢，需要进行8bit量化；

但是其也有一些缺点：

增加了操作复杂度，有时会有一些特殊处理，甚至会有tradeoff，比如你发明了一个牛13的算子，可惜现有的量化工具不支持，自己实现又头大，只能忍痛割爱；
会损失一定的精度，所以有时会有微调，但也会有损失；不过值得一提的是，每次我用openvino量化，精度不降低反而还会升高一丢丢。这是因为模型参数是非常冗余的，量化可以看成一种正则化技术，会提升模型的泛化能力，可能在测试集上会表现好一点。不过

最低0.47元/天解锁文章

weixin_39613433

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。