说话人识别进行的加权小波去噪方法笔记

   通过两方面提高说话人识别系统环境的鲁棒性:(1)在特征参数提取的过程中加入一些提高噪声鲁棒性的措施,如采用自相关去噪处理(RAS)等技术,或通过选取具有强耐噪性的特征参数来提高鲁棒性;(2)在模型训练过程中加入提高鲁棒性的措施。如 模型补偿方法、模型自适应技术等。本文主要研究如何得到具有强耐噪性能的特征参数。

   在感知倒谱分析的基础上引入了多分辨率小波分析技术,利用小波变换的时频局域性并结合感知频域上的滤波技术,提出了一种基于离散小波变换和感知频域滤波的算法,一种新型强耐噪性的语音特征——小波变换Mel倒谱系数。

 语音信号系统的特征是信号、噪声的频谱较宽且重叠,噪声传递函数复杂甚至为IIR函数,改变其性能的方法是把输入信号进行正交化降价处理,减少特征值的分散度,如格型滤波器,Gram-Schmidt正交化,离散傅里叶变换。本文的方法如图一。

其中X为含噪语音信号,N'为与X中的噪声N类似的噪声,AS3,DS3,DS2,DS1是输入语音经过小波分解后的低频分量和高频分量;AN3,DN3,DN3',DN1是噪声经过小波分解后的低频分量和高频分量;AE3,DE3,DE2,DE1是语音各分量通过ANC处理后的低频分量和高频分量,Y是经过小波重构后的输出。把离散小波分解和重构应用于自适应消噪系统中,通过不同的小波基把输入信号和噪声分解于不同的频段中,然后在各个频段分别进行自适应去噪,由于噪声和信号得到简化,因此减少了滤波器的级数,是系统的收敛时间和去噪效果提高。在小波重构之前对各小波系数进行加权处理,然后再把各个频段的输出通过小波重构恢复信号,最后通过MEL滤波器组把小波系数转化为MFCC。

离散小波变换自适应消噪系统

    通过多尺度分析可构造正交小波基,并且在多尺度分析上产生有限尺度二进制小波的Mallat算法。

离散平滑逼近递推公式

     输入信号是X(含噪信号),即X=S+N'(S为输入信号,N'为与N相关的同源噪声),先把X,N经过小波分解,分解于不同的频段内,则输入信号经过小波变换后,再在不同的频段中分别对他们进行自适应噪声抵消,递推表如下:

根据说话人识别的特点,即在高频(》2000HZ)和在低频(《500HZ)比中间频含有更多的说话人信息,因而在小波重构之前对各小波系数进行加权处理,其递推表达式:

总结

在噪声环境下的说话人识别框架图

 

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

落雪snowflake

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值