python 数据量化

最新推荐文章于 2024-03-09 09:00:00 发布

做一个纯粹的人

最新推荐文章于 2024-03-09 09:00:00 发布

阅读量2.4k

点赞数 1

分类专栏：实习ing 文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/weixin_46178043/article/details/121863072

版权

实习ing 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

##音频数据量化：
r :浮点实数
q：量化后的定点整数

r = s(q-z)
q = round(r/s+z)
s = (rmax-rmin)/(qmax-qmin)
z = round(qmax - rmax/s)
例如我们对音频取完mel，得到mel，这时我们对其取log进行限幅，例如限幅度在-3至3之间或者对其取均值除方差操作，总之让其归一化到一段区间，之后对其量化8比特-（0-255）最后再将其反量化回去。

 r_min = -3
 r_max = 3
 q_max =255
 q_min = 0
        
 q = torch.round((log_mel+3)*255/6)
 s = (r_max -r_min)/(q_max-q_min)
 z = round(q_max-r_max/s)
 log_mel = s*(q-z)

做一个纯粹的人

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 数据量化

##音频数据量化：r :浮点实数q：量化后的定点整数r = s(q-z)q = round(r/s+z)s = (rmax-rmin)/(qmax-qmin)z = round(qmax - rmax/s)例如我们对音频取完mel，得到mel，这时我们对其取log进行限幅，例如限幅度在-3至3之间或者对其取均值除方差操作，总之让其归一化到一段区间，之后对其量化8比特-（0-255）最后再将其反量化回去。 r_min = -3 r_max = 3 q_max =255 q_min = 0
复制链接

扫一扫