量化感知训练_pytorch量化备忘录

本文介绍了量化的基本概念,包括为什么要做量化、量化的好处和缺点。重点讲解了PyTorch中的量化步骤、量化方式,如Post Training Dynamic/Static Quantization和Quantization Aware Training,并详细阐述了后训练量化的过程,包括模型准备、模块融合、量化算法选择、observer插入、校准以及模块转化。最后讨论了量化模型的使用方法。
摘要由CSDN通过智能技术生成

a5dc92085f8c383b886d4b97780dbbdf.png

什么是量化?

将高精度运算转化到低精度上运算,例如float32转化为int8数据上运算。

为什么要量化?

那就要说说量化的好处了,一般量化有以下好处:

  • 减小模型尺寸和存储空间,如int8量化可减少75%的模型大小;
  • 加快推理速度,访问一次32位浮点型可以访问四次int8型,运算更快;
  • 减少设备功耗,内存耗用少了推理速度快了自然减少了设备功耗;
  • 支持微处理器,有些微处理器属于8位的,低功耗运行浮点运算速度慢,需要进行8bit量化;

但是其也有一些缺点:

  • 增加了操作复杂度,有时会有一些特殊处理,甚至会有tradeoff,比如你发明了一个牛13的算子,可惜现有的量化工具不支持,自己实现又头大,只能忍痛割爱;
  • 会损失一定的精度,所以有时会有微调,但也会有损失;不过值得一提的是,每次我用openvino量化,精度不降低反而还会升高一丢丢。这是因为模型参数是非常冗余的,量化可以看成一种正则化技术,会提升模型的泛化能力,可能在测试集上会表现好一点。不过
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值