Python音频转成numpy数组：numpy.frombuffer报错ValueError: buffer size must be a multiple of element size

最新推荐文章于 2025-03-22 17:52:48 发布

Dr. 卷心菜

最新推荐文章于 2025-03-22 17:52:48 发布

阅读量1.2w

点赞数 2

分类专栏：八阿哥图鉴文章标签： numpy 音频编码解码信号处理数字信号处理

本文链接：https://blog.csdn.net/veritasalice/article/details/104807415

版权

八阿哥图鉴专栏收录该内容

12 篇文章

订阅专栏

本文详细解析了在导入音频信号时遇到的错误及其解决方法，重点介绍了如何根据量化位数正确设置numpy的数据类型，以及使用wavio包处理24bit量化位数的音频。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用背景：导入音频信号，下面代码段最后一句报错

import wave
import numpy as np

f = wave.open(wav_path)
params = f.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]
# 声道数; 量化位数(byte); 采样频率; 采样点数
str_audio = f.readframes(nframes)
f.close()

audio = np.frombuffer(str_data, dtype=np.short)

问题解决：最后一句dtype的参数改成与自己的声音信号相一致

查看sampwidth这一参数，量化位数（sampwidth）就是记录声波每次采样所需的位数，一般有16,24,32位：

sampwidth(byte)	dtype
2byte=16bit	int16 or i2 (整型short)
3byte=24bit	需要wavio包读取
4byte=32bit	int32 or i4 (长整型long)

数据量（总b） = 采样频率(Hz) x 量化位数(bit) x 时间(s) x 声道数(个)
数据量（总B） = 采样频率(Hz) x 量化位数(bit) x 时间(s) x 声道数(个) / 8

如果音频的量化位数为24bit，如何读取？

可以使用wavio包，直接读取成numpy数组

import wavio

audio = wavio.read(wav_path)

附上wavio的github链接：

https://github.com/WarrenWeckesser/wavio/blob/master/wavio.py