想用IPython.display 播放一个音频的时候遇到这样一个错误,和普通的音频数据对比发现我的采样频率是二维的,像这样
后面出现错误的原因就是因为读到的数据是语音文件的采样频率,有两列,表示是双声道语音信号,取单声道就OK啦
x, sr = sf.read(speak_file)
x= np.mean(x, axis=1, dtype=x.dtype) # 加上这个就OK了
想用IPython.display 播放一个音频的时候遇到这样一个错误,和普通的音频数据对比发现我的采样频率是二维的,像这样
后面出现错误的原因就是因为读到的数据是语音文件的采样频率,有两列,表示是双声道语音信号,取单声道就OK啦
x, sr = sf.read(speak_file)
x= np.mean(x, axis=1, dtype=x.dtype) # 加上这个就OK了