功能描述
因为在研究使用openSMILE提取特征时,需要对语音进行分割,我找了很多方法,都无法实现自己想要效果,语音自己实现了语音分割并保存的代码,我测试了一下,可以达到自己想要的结果,因此写一篇博客,方便自己后期查看,也可以分享给大家参考。
功能为:给定一个语音句子,将这个句子等分几个片段,并保存为.wav文件。
代码实现和分析
大家如果想尝试,自己在代码所在文件夹下准备一个.wav语音文件,新建一个文件夹,修改代码里的语音名和文件夹名,运行即可实现语音分割。
实现代码如下:
import wave
import numpy as np
def read_file(filename):
file = wave.open(filename, 'r')
params = file.getparams()
nchannels, sampwidth, framerate, wav_length = params[:4]
str_data = file.readframes(wav_length)
wavedata