webrtcvad模块使用

本文档记录了使用Python的webrtcvad模块进行语音活动检测(VAD)的过程,包括模块安装、参考代码示例以及如何在Windows和Linux环境下调整文件路径。通过示例代码,展示了如何保存VAD处理后的完整语音片段,并对比了处理前后的语音波形效果。
摘要由CSDN通过智能技术生成

最近在实现一个功能的时候,用到了webrtc模块的vad部分的python版本,因参考的原博客找不到链接了,为了方便自己以后查阅相关内容,故整理成博客供日后方便。接下来开始正题,当然了,要想使用这个webrtcvad,自然就是安装它了,命令也很简单。

pip install webrtcvad

关于该包的使用,github上有提供一个example.py,可以参照该example.py文件使用webrtcvad。网址为https://github.com/wiseman/py-webrtcvad/blob/master/example.py。 不过该代码运行的结果是切分后的片段。接下来整理的是将vad后的片段整个保存。下面是整个代码,相关参数的含义可以查看webrtcvad的文档。

import contextlib
import wave
import webrtcvad
import os
import sys
import collections
MODE = 3 
def read_wave(path):
    """Reads a .wav file.
    Takes the path, and returns (PCM audio data, sample rate).
    "
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值