作者:桂。
时间:2017-05-31 17:43:22
链接:http://www.cnblogs.com/xingshansi/p/6925355.html
前言
总结一下基本的有话帧检测(Voice activity detection, VAD)技术,基于神经网络的待后面梳理完神经网络的理论后再作整理。
一、双门限
这是一种Boosting的思路,即:两个弱分类器可以组合更强的分类器,依次类推,三、四门限其实都可。每一种门限对应一种判决准则。
基本的双门限:短时能量+短时过零率,其原理是元音能量较大,用短时平均能量检测,辅音频率较高,用短时平均过零率检测。
考虑到噪声的影响,通常作平滑处理。如:中值滤波,medfilt.
二、相关
该算法通过计算信号的相关系数,主要利用信号、噪声相关系数的差异性。依次扩展的方法包括:1