说话人识别进行的加权小波去噪方法笔记

最新推荐文章于 2022-12-21 20:18:52 发布

落雪snowflake

最新推荐文章于 2022-12-21 20:18:52 发布

阅读量573

点赞数

分类专栏：消噪文章标签：说话人识别在噪声环境下的方法

本文链接：https://blog.csdn.net/weixin_38858860/article/details/83744034

版权

说话人识别同时被 2 个专栏收录

20 篇文章 1 订阅

订阅专栏

消噪

1 篇文章 0 订阅

订阅专栏

通过两方面提高说话人识别系统环境的鲁棒性：（1）在特征参数提取的过程中加入一些提高噪声鲁棒性的措施，如采用自相关去噪处理（RAS）等技术，或通过选取具有强耐噪性的特征参数来提高鲁棒性；（2）在模型训练过程中加入提高鲁棒性的措施。如模型补偿方法、模型自适应技术等。本文主要研究如何得到具有强耐噪性能的特征参数。

在感知倒谱分析的基础上引入了多分辨率小波分析技术，利用小波变换的时频局域性并结合感知频域上的滤波技术，提出了一种基于离散小波变换和感知频域滤波的算法，一种新型强耐噪性的语音特征——小波变换Mel倒谱系数。

语音信号系统的特征是信号、噪声的频谱较宽且重叠，噪声传递函数复杂甚至为IIR函数，改变其性能的方法是把输入信号进行正交化降价处理，减少特征值的分散度，如格型滤波器，Gram-Schmidt正交化，离散傅里叶变换。本文的方法如图一。

其中X为含噪语音信号，为与X中的噪声N类似的噪声，AS3,DS3,DS2,DS1是输入语音经过小波分解后的低频分量和高频分量；AN3,DN3,DN3',DN1是噪声经过小波分解后的低频分量和高频分量；AE3,DE3,DE2,DE1是语音各分量通过ANC处理后的低频分量和高频分量，Y是经过小波重构后的输出。把离散小波分解和重构应用于自适应消噪系统中，通过不同的小波基把输入信号和噪声分解于不同的频段中，然后在各个频段分别进行自适应去噪，由于噪声和信号得到简化，因此减少了滤波器的级数，是系统的收敛时间和去噪效果提高。在小波重构之前对各小波系数进行加权处理，然后再把各个频段的输出通过小波重构恢复信号，最后通过MEL滤波器组把小波系数转化为MFCC。

离散小波变换自适应消噪系统

通过多尺度分析可构造正交小波基，并且在多尺度分析上产生有限尺度二进制小波的Mallat算法。

离散平滑逼近递推公式

输入信号是X（含噪信号），即X=S+N'（S为输入信号，N'为与N相关的同源噪声），先把X,N经过小波分解，分解于不同的频段内，则输入信号经过小波变换后，再在不同的频段中分别对他们进行自适应噪声抵消，递推表如下：

根据说话人识别的特点，即在高频（》2000HZ）和在低频（《500HZ）比中间频含有更多的说话人信息，因而在小波重构之前对各小波系数进行加权处理，其递推表达式：

总结

在噪声环境下的说话人识别框架图

落雪snowflake

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
说话人识别进行的加权小波去噪方法笔记

采用改进的小波去噪算法对噪语音进行前端处理，并针对说话人的识别特点，在小波重构之前对各小波系数进行加权处理，识别过程采用gmm识别算法。相比纯粹使用MFCC作为识别特征的说话人识别提出的方法对于含噪声说话认识别有明显的优越性。
复制链接

扫一扫