Python中将numpy Int16类型的音频阵列转换为Float32类型

字符搬运工s

已于 2022-10-31 19:59:56 修改

阅读量4.4k

点赞数 1

分类专栏： Python 文章标签： numpy python 音视频

于 2022-09-07 15:40:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43522889/article/details/126746629

版权

Python 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

目前语音处理中，我们存储较多的音频格式为numpy Int16类型的，但在对音频文件进一步做处理时，有时候会需要转换为float32类型的数据使用。这里转换方式如下：

（1）读取原始二进制int16类型的音频数据，将其转换为numpy数组存储

audio=np.fromstring（原始数据，dtype=np.int16）

（2）将numpy int16类型音频数据转换为float32类型数据

audio=audio.astype（np.float32，order='C'）

（3）将音频保存到磁盘，以便通过SoundFile类进一步处理

soundfile.write（'out.wav'，音频，采样率）

上述操作虽然可以完成数据转化并将音频文件其写入磁盘，但通常情况下我们会将浮点音频数据进行标准化，将数据缩放至 [-1.0, 1.0] 之间，则通常使用如下代码完成：

audio = audio.astype(np.float32, order='C') / 32768.0

注：有符号整数的可表示范围为：-32768~32767。使用/32768.0只会有0.00026分贝的差异，这种误差在大部分情况下是可以允许的。

字符搬运工s

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Python中将numpy Int16类型的音频阵列转换为Float32类型

Python中将numpy Int16类型的音频阵列转换为Float32类型
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。