常见模型量化方法介绍

最新推荐文章于 2024-06-21 11:12:08 发布

新嬉皮士

最新推荐文章于 2024-06-21 11:12:08 发布

阅读量2.6k

点赞数

分类专栏：模型部署文章标签：深度学习边缘计算计算机视觉

本文链接：https://blog.csdn.net/qq_39450134/article/details/127606787

版权

模型部署专栏收录该内容

1 篇文章 0 订阅

订阅专栏

随着深度学习技术的快速发展，越来越多的领域开始与之融合在一起。许多传统领域借助深度学习的赋能解决了很多之前解决不了的问题或者更好的解决了之前的一些问题。于此同时，成本因素也是深度学习技术在各行各业深度融合中不可忽视的因素。所以将深度学习模型部署在边缘设备上对该技术的广泛应用有重要意义。其中模型量化就是一个在减小模型计算量和缩减模型大小的同时保障精度基本不变的技术，这对模型的部署而言有重要意义。在本文中将介绍工业中一些常见的模型量化方法。
经典量化论文《Quantizing deep convolutional networks for efficient inference: A whitepaper》链接: link

一、对称量化

对称量化的一个关键点是零点，即原始的输入数据中的零点通过映射关系转换后仍然对应int8表示的范围[-128，127]中的零点。但是该量化方式的缺点是为了保持量化效果的对齐，存在无法完全有效利用范围。
原输入：max_float = 0.7，min_float = 0.4
对应输出：s = 127/0.7 = 181.42…
max_int8 = 127, min_int8=72.568
本质上就是将浮点数的范围由[min_float，max_float]转换成了[-max_int8,max_int8],
其中:
s = 127/(max(|max_float|,|min_float|))
max_int8 = max_floatS
min_int8 = min_floatS

二、非对称量

非对称量的操作简而言之就是将输入数据映射在[0，255]的范围内，我们只需要确定Z参数(zero_point)和S参数就能求解到对应的映射转换关系。该量化方法使用较多，量化效果较好。
对应转换公式:
S = 255/(max_float - min_float)
Z = 255 - max_float/S