##音频数据量化:
r :浮点实数
q:量化后的定点整数
r = s(q-z)
q = round(r/s+z)
s = (rmax-rmin)/(qmax-qmin)
z = round(qmax - rmax/s)
例如我们对音频取完mel,得到mel,这时我们对其取log进行限幅,例如限幅度在-3至3之间或者对其取均值除方差操作,总之让其归一化到一段区间,之后对其量化8比特-(0-255)最后再将其反量化回去。
r_min = -3
r_max = 3
q_max =255
q_min = 0
q = torch.round((log_mel+3)*255/6)
s = (r_max -r_min)/(q_max-q_min)
z = round(q_max-r_max/s)
log_mel = s*(q-z)