降噪算法概述

  1. 语音增强技术概述

在通信过程中语音受到来自周围环境、传输媒介引入的噪声,使接收到的语音信号并非纯净的原始语音信号,而是受噪声污染的带噪语音信号。这里的“噪音”定义为所需语音信号以外的所有干扰信号。

干扰信号可以是窄带的或宽带的、白噪声的或有色噪声的、声学的或电学的、加性的或乘性的,甚至可以是其它无关的语音。由噪声导致的语音质量的下降会使许多语音处理系统的性能急剧恶化。采用语音增强技术进行预处理,可有效地改善系统性能。

  1. 语音增强的目的

对收听人而言主要是改善语音质量,提高语音可懂度,减少疲劳感;对语音处理系统(识别器、声码器、手机)而言是提高系统的识别率和抗干扰能力。

  1. 语音信号的相关特性

增强与语音信号处理理论有关,而且涉及到人的听觉感知和语音学。噪声来源众多,随应用场合不同而特性各异,因此难以找到一种通用的语音增强算法可以适用于各种噪声环境,必须针对不同环境下的噪声采取不同的语音增强策略。因此,要进行语音增强首先要了解语音特性、人耳感知特性和噪声特性。

    1.  语音特性
      1. 语音信号具有短时平稳性

声道形状有相对稳定性,在一段时间内(10ms~30ms),人的声带和声道形状是相对稳定的,可认为其特征是不变的,因而语音的短时谱具有相对稳定性,在语音分析中可以把语音信号分为若干分析帧,每一帧的语音可以认为是准稳定的。语音增强可以利用这种短时平稳性。

      1. 语音信号可以分为浊音和清音

语音可以分为周期性的浊音和非周期性的清音。在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而清音则难以与宽带噪声区分。

      1. 语音信号可以利用统计分析特征描述

作为一个随机过程,语音信号可以利用许多统计分析特征进行分析。语音的短时谱幅度统计特征是时变的,只有当分析帧长趋于无穷大时,才能近似具有高斯分布。在高斯模型的假设中,可以认为傅里叶展开系数是独立的高斯随机变量,均值为零,而方差是时变的。在有限帧长时这种高斯模型只是一种近似的描述,可以作为分析的前提在宽带噪声污染的带噪语音增强中应用。

    1.  人耳感知特性

人耳对语音的感知主要是通过语音信号频谱分量幅度获取的,对各分量相位则不敏感,对频率高低的感受近似与该频率的对数值成正比。人耳具有掩蔽效应,人耳除了可以感受声音的强度、音调、音色和空间方位外,还可以在两人以上的讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关,称为“鸡尾酒会效应”。语音增强的最终效果度量是人耳的主观感觉,所以在语音增强中可以利用人耳感知特性来减少运算代价。

    1.  噪声特性

根据与输入语音信号的关系,噪声可分为加性噪声和非加性噪声两类。对某些非加性噪声而言,可以通过一定的变换转换成加性噪声。语音处理中的加性噪声大体上可以分为周期性噪声、脉冲噪声、宽带噪声和同声道其他语音的干扰等。

    1.  周期性噪声

周期性噪声主要来源于发动机等周期性运转的机械,电气干扰也会引起周期性噪声。特点是频谱上有许多离散的线谱。实际信号受多种因素的影响,线谱分量通常转变为窄带谱结构,而且通常这些窄带谱都是时变的,位置也不固定。必须采用自适应滤波的方法才能有效地区分这些噪声分量。

    1.  脉冲噪声

脉冲噪声来源于爆炸、撞击、放电及突发性干扰等。特征是时间上的宽度很窄。在时域消除脉冲噪声过程如下:根据带噪语音信号幅度的平均值确定阈值。当信号超出这一阈值时判别为脉冲噪声。然后对信号进行适当的衰减,就可完全消除噪声分量,也可以使用内插方法将脉冲噪声在时域上进行平滑。

    1.  宽带噪声

宽带噪声来源很多,热噪声、气流噪声及各种随机噪声源、量化噪声都可以视为宽带噪声。宽带噪声与语音信号在时域和频域上基本上重叠,只有在无话期间,噪声分量才单独存在。因此消除这种噪声比较困难。对于平稳的宽带噪声,通常可以认为是白色高斯噪声。

    1.  同声道语音干扰

干扰语音信号和待传语音信号同时在一个信道中传输所造成的语音干扰称为同声道语音干扰。区别有用语音和干扰语音的基本方法是利用它们的基音差别。考虑到一般情况下两种语音的基音不同,也不成整数倍,这样可以用梳状滤波器提取基音和各次谐波,再恢复出有用语音信号

    1. 传输噪声

这是传输系统的电路噪声。处理这种噪声可以采用同态处理的方法,把非加性噪声变换为加性噪声来处理。

引用\[1\]: 非局部方法在去噪性能上优于局部方法,特别是对于高斯噪声。然而,NLM方法存在明显的不足,仍然有很大的改进空间,比如:较高的计算复杂度、相似性权重的计算公式受噪声影响较大和去噪参数确定不准等。引用\[3\]: 目前已有的许多图像去噪方法大多是基于“局部平滑”(例如,传统的均值滤波器和高斯滤波器)。虽然这类方法是有效的,但由于缺乏自适应性会导致图像模糊。从下面四幅灰度图像可以看出,它们都含有很多相似重复的纹理信息,考虑在大多数图像中出现的冗余信息,研究人员发现图像的自相似性可以应用于图像去噪领域。2005年,Buades等人首次提出了一种非局部均值(NLM)去噪算法。该算法充分利用图像中的自相似性达到去噪的目的,首先通过计算邻域间的欧式距离得到相似性权值,然后使用相似像素的加权平均得到去噪图像。这种计算权值的方法仅与图像块的相似性有关,与位置无关因此很好的避免了虚假纹理的产生。与传统的去噪算法相比,NLM算法具有算法简单、去噪性能好、易于改进和扩展的特点。 根据提供的引用内容,logMMSE降噪算法并未被直接提及。然而,根据已有的图像去噪方法,我们可以推测logMMSE降噪算法可能是一种基于局部平滑的方法。与传统的均值滤波器和高斯滤波器相比,logMMSE降噪算法可能具有更好的自适应性,以避免图像模糊。然而,具体的算法细节和性能表现需要进一步的研究和了解。 #### 引用[.reference_title] - *1* *2* *3* [经典图像去噪算法概述](https://blog.csdn.net/SmartLab307/article/details/127271140)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值