模型部署过程中遇到问题最多的是量化环节,最复杂的,也是量化。我接触神经网络的时间不算长,接触量化就更短了,但是从第一次了解量化这个概念起,就有一个问题深深的困扰着我,简单描述如下。
首先描述一下我对量化的认知:
- 量化是个访射变换,将x变换为 px+q, y量化为mx+n.
- 在n,q不为0的情况下,量化后的数据如何反量化回去呢?看公式,根据量化得到的二次式反推xy是很困难的,总会有一次项存在.
- 量化类似于给视频打码,只要不是全屏马赛克,经历过青春期训练的你是一定能脑补出细节来的.
已经同时请教了四位算法专家,等候答复中。。。。。
附:
参考NCNN的量化逻辑,它是对称量化,比较好做
这张图有个地方应该是画错了:
流程图:
类比概念-原子量
原子量即相对原子质量,它是一种计算原子质量的方式,由于原子的实际质量很小,如果人们用它们的实际质量来计算的话那就非常的麻烦,例如一个氢原子的实际质量为1.674×10⁻²⁷千克,一个氧原子的质量为2.657×10⁻²⁶千克。一个碳-12原子的质量为1.993×10⁻²⁶千克。元素的相对原子质量是其各种同位素相对原子质量的加权平均值。利用原子量进行计算,相当于分子分母都乘以相同的数字,结果不变。