模型量化Calibration

最新推荐文章于 2024-06-04 15:24:40 发布

jwy2014

最新推荐文章于 2024-06-04 15:24:40 发布

阅读量2.7k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/jwy2014/article/details/103700407

版权

量化校准过程（预处理阶段），我们使用验证集中的一小部分图片（通常为整个数据集的 1-5%）来收集数据分布的信息，包括最小值 / 最大值、基于熵理论的最佳阈值、基于对称量化的量化因子等。最终，这些量化参数会被记录在新生成的量化模型中。 Calibration 如果要让最后的精度损失不大，是要考虑一些先验知识的，这个先验知识就是每一层在 FP32精度下的激活值分布，只有根据这个...

摘要由CSDN通过智能技术生成

量化校准过程（预处理阶段），我们使用验证集中的一小部分图片（通常为整个数据集的 1-5%）来收集数据分布的信息，包括最小值 / 最大值、基于熵理论的最佳阈值、基于对称量化的量化因子等。最终，这些量化参数会被记录在新生成的量化模型中。
Calibration

如果要让最后的精度损失不大，是要考虑一些先验知识的，这个先验知识就是每一层在 FP32精度下的激活值分布，只有根据这个才能找到更加合理的阈值|T|。也就是说首先得有一个以FP32精度训练好的模型。基本上现有的深度学习框架都是默认 FP32精度的，有些模型还支持FP16精度训练，貌似 Caffe2和MXNet是支持FP16的，其他的不太清楚。所以基本上只要没有特别设定，训练出来的模型肯定是 FP32 的。

那激活值分布如何得到？难道我们要将FP32的模型先在所有的测试集（或验证集）上跑一边记录下每一层的FP32激活值，然后再去推断 |T|?

这里的做法是从验证集选取一个子集作为校准集（Calibration Dataset ），校准集应该具有代表性，多样性，最好是验证集的一个子集，不应该只是分类类别的一小部分。激活值分布就是从校准集中得到的。

按照NVIDIA 官方的说法：

Note: The calibration set must be representative of the input provided to Te

最低0.47元/天解锁文章

jwy2014

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
模型量化Calibration

量化校准过程（预处理阶段），我们使用验证集中的一小部分图片（通常为整个数据集的 1-5%）来收集数据分布的信息，包括最小值 / 最大值、基于熵理论的最佳阈值、基于对称量化的量化因子等。最终，这些量化参数会被记录在新生成的量化模型中。 Calibration 如果要让最后的精度损失不大，是要考虑一些先验知识的，这个先验知识就是每一层在 FP32精度下的激活值分布，只有根据这个...
复制链接

扫一扫

专栏目录