关于webrtc的VAD（voice activity dectctor)算法说明

最新推荐文章于 2023-10-13 12:07:01 发布

felix_chgm

最新推荐文章于 2023-10-13 12:07:01 发布

阅读量1.3w

点赞数 2

分类专栏：前后处理算法文章标签：算法 webrtc VAD 语音前后处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012931018/article/details/16903027

版权

前后处理算法专栏收录该内容

3 篇文章 1 订阅

订阅专栏

关于webrtc的VAD（voice activity dectctor)算法说明

webrtc 的vad使用GMM(Gaussian Mixture Model)对语音和噪声建模，通过相应的概率来判断语音和噪声。这种算法

的优点是它是无监督的，不需要严格的训练。GMM的噪声和语音模型如下：

p(xk|z,rk)={1/sqrt(2*pi*sita^2)} * exp{ - (xk-uz) ^2/(2 * sita ^2 )}

XK是选取的特征量,在webrtc的VAD中具体是指子带能量,rk是包括均值uz和方差sita的参数集合。z=0，代表噪声；z=1，代表语音。

webrtc中的vad的C代码的详细步骤如下：

1.设定模式：

依据hangover、单独判决和全局判决门限将VAD检测模式分为以下4类

0-quality mode

1- Low bitrate mode

2-Aggressive mode

3- Very aggressive mode

2.webrtc的VAD只支持帧长10ms，20ms和30ms，为此事先要加以判断，不符合条件的返回-1。

3.webrtc 的VAD核心计算只支持8KHz采样率，所以当输入信号采样率为32KHz 或者16KHz 时都要先下采样到8KHz 。

4.在8Khz采样率上分为两个步骤

4.1 计算子带能量

子带分为80～250Hz，250～500Hz，500～1000Hz，1000～2000Hz，2000～3000Hz，3000～4000Hz

需要分别计算上述子带的能量feature_vector。

4.2 通过高斯混合模型分别计算语音和非语音的概率，使用假设检验的方法确定信号的类型。

首先通过高斯模型计算假设检验中的H0和H1（C代码是用h0_test和h1_test表示），通过门限判决vadflag;

然后更新概率计算所需要的语音均值(speech_means)、噪声的均值(noise_means)、语音方差(speech_stds)

和噪声方差(noise_stds)。

关注

2
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
关于webrtc的VAD（voice activity dectctor)算法说明

关于webrtc的VAD（voice activity dectctor)算法说明 webrtc 的vad使用GMM(Gaussian Mixture Model)对语音和噪声建模，通过相应的概率来判断语音和噪声。这种算法的优点是它是无监督的，不需要严格的训练。GMM的噪声和语音模型如下： p(xk|z,rk)={1/sqrt(2*pi*sita^2)} *
复制链接

扫一扫

专栏目录

felix_chgm CSDN认证博客专家 CSDN认证企业博客

码龄10年

3: 原创

53万+: 周排名

107万+: 总排名

5万+: 访问

: 等级

351: 积分

33: 粉丝

8: 获赞

6: 评论

48: 收藏

私信

关注

热门文章

分类专栏

前后处理算法 3篇
感悟

最新评论

webrtc 的回声抵消(aec、aecm)算法简介
qq_38288216: 兄弟可以详细给我说下这个 delay值吗，现在我写的demo 一个手机声音大一个手机声音很小是不是跟这个值有关
webrtc 的回声抵消(aec、aecm)算法简介
weixin_38305066 回复 Huang_Qi_Zhen: 您好，我现在也遇到了与您一样的问题，请问您是怎样解决的？谢谢！
webrtc 的回声抵消(aec、aecm)算法简介
zxw_download: 您好，您有关于webrtc中AGC的算法原理的介绍吗？您若慷慨相授，请您发送e-mail到[email protected].谢谢！
开源speex的语音增强(去噪)算法介绍
oYiSuoYanYu123456: 寻求帮助，QQ [email protected]
webrtc 的回声抵消(aec、aecm)算法简介
Huang_Qi_Zhen: 您好，博主，能否与您交流下回音消除的有关问题吗？如若有幸请加下我Q：273893560

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。