通过两方面提高说话人识别系统环境的鲁棒性:(1)在特征参数提取的过程中加入一些提高噪声鲁棒性的措施,如采用自相关去噪处理(RAS)等技术,或通过选取具有强耐噪性的特征参数来提高鲁棒性;(2)在模型训练过程中加入提高鲁棒性的措施。如 模型补偿方法、模型自适应技术等。本文主要研究如何得到具有强耐噪性能的特征参数。
在感知倒谱分析的基础上引入了多分辨率小波分析技术,利用小波变换的时频局域性并结合感知频域上的滤波技术,提出了一种基于离散小波变换和感知频域滤波的算法,一种新型强耐噪性的语音特征——小波变换Mel倒谱系数。
语音信号系统的特征是信号、噪声的频谱较宽且重叠,噪声传递函数复杂甚至为IIR函数,改变其性能的方法是把输入信号进行正交化降价处理,减少特征值的分散度,如格型滤波器,Gram-Schmidt正交化,离散傅里叶变换。本文的方法如图一。
其中X为含噪语音信号,为与X中的噪声N类似的噪声,AS3,DS3,DS2,DS1是输入语音经过小波分解后的低频分量和高频分量;AN3,DN3,DN3',DN1是噪声经过小波分解后的低频分量和高频分量;AE3,DE3,DE2,DE1是语音各分量通过ANC处理后的低频分量和高频分量,Y是经过小波重构后的输出。把离散小波分解和重构应用于自适应消噪系统中,通过不同的小波基把输入信号和噪声分解于不同的频段中,然后在各个频段分别进行自适应去噪,由于噪声和信号得到简化,因此减少了滤波器的级数,是系统的收敛时间和去噪效果提高。在小波重构之前对各小波系数进行加权处理,然后再把各个频段的输出通过小波重构恢复信号,最后通过MEL滤波器组把小波系数转化为MFCC。
离散小波变换自适应消噪系统
通过多尺度分析可构造正交小波基,并且在多尺度分析上产生有限尺度二进制小波的Mallat算法。
离散平滑逼近递推公式
输入信号是X(含噪信号),即X=S+N'(S为输入信号,N'为与N相关的同源噪声),先把X,N经过小波分解,分解于不同的频段内,则输入信号经过小波变换后,再在不同的频段中分别对他们进行自适应噪声抵消,递推表如下:
根据说话人识别的特点,即在高频(》2000HZ)和在低频(《500HZ)比中间频含有更多的说话人信息,因而在小波重构之前对各小波系数进行加权处理,其递推表达式:
总结
在噪声环境下的说话人识别框架图