用python实现语音的分割并保存为.wav文件

王小运e

已于 2022-09-25 18:24:57 修改

阅读量4.4k

点赞数 4

分类专栏：语音相关笔记文章标签： python 语音分割

于 2022-09-25 18:13:06 首次发布

本文链接：https://blog.csdn.net/weixin_42103947/article/details/127040741

版权

功能描述

因为在研究使用openSMILE提取特征时，需要对语音进行分割，我找了很多方法，都无法实现自己想要效果，语音自己实现了语音分割并保存的代码，我测试了一下，可以达到自己想要的结果，因此写一篇博客，方便自己后期查看，也可以分享给大家参考。
功能为：给定一个语音句子，将这个句子等分几个片段，并保存为.wav文件。

代码实现和分析

大家如果想尝试，自己在代码所在文件夹下准备一个.wav语音文件，新建一个文件夹，修改代码里的语音名和文件夹名，运行即可实现语音分割。
实现代码如下：

import wave
import numpy as np


def read_file(filename):
    file = wave.open(filename, 'r')
    params = file.getparams()
    nchannels, sampwidth, framerate, wav_length = params[:4]
    str_data = file.readframes(wav_length)
    wavedata