端点检测(VAD)技术

端点检测是语音识别和语音处理的一个基本环节,也是语音识别研究的一个热点领域。技术的主要目的是从输入的语音中对语音和非语音进行区分,主要功能可以有:

    1. 自动打断。
    2. 去掉语音中的静音成分。
    3. 获取输入语音中有效语音。
    4. 去除噪声,对语音进行增强。

目前,端点检测技术主要是根据语音的一些时域或频域特征进行区分。

一,时域参数

时域参数端点检测是根据时域中的特征参数进行区分,一般如果信噪比较高的时候,效果至少90%以上。

  1. 时域能量大小。
  2. 时域平均过零率。
  3. 短时相关性分析。相关性分析主要是利用语音的相关性比噪声强,噪声之间的相关性呈现下降的趋势,但因为噪声种类太多,因此只针对少量、特定噪声。
  4. 能量变化率。也有人用这个,没有实验过。
  5. 对数能量。
  6. 子带能量。实验表明,这个效果会比单纯的能量要好。
  7. GMM假设检验。
  8. 其它。其它也有一些,都是从自适应、噪声能量估计、信噪比估计等角度出发。

二,频域参数

频域参数的抗噪性会比时域要好,但计算的cost也要高,下列技术是主流

  1. 谱熵。谱熵在频域与时域较量时,是比较优秀的,鲁棒性明显好于时域。
  2. 频域子带。这种方法对于自适应类的算法来说,是比较优秀的,因为可以通过子带选择和设计,改变噪声的估计。
  • 5
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值