Deep learning for minimum mean-square error approaches to speech enhancement

介绍
目标是缩小MMSE和深度学习语音增强方法之间的差距,生成比最近基于masking和mapping的深度学习方法更高质量和可理解性分数的增强语音。
研究了深度学习方法可以为上述MMSE方法提供的性能改进。每种MMSE方法都需要对带噪语音频谱成分进行先验信噪比(SNR)估计。
这里采用了深度学习的方法准确估计先验信噪比。 在这项工作中,使用语音质量和可懂度的主客观测量来评估使用深度学习的MMSE方法。测试条件包括真实世界的非平稳噪声源和多个信噪比水平的有色噪声源。将使用深度学习的MMSE方法与最近基于掩蔽和映射的语音增强深度学习方法进行了比较。利用帧方向谱失真(SD)水平来评估所提出的先验SNR估计器的精度。并以先验信噪比(SNR)、信噪比(IRM)和干净语音幅度谱作为训练目标,对语音增强性能进行了评价。论文的组织结构如下:第2节介绍背景知识,包括语音增强的分析、修改和合成(AMS)过程和MMSE方法;第3节描述映射的先验信噪比训练目标;第4节描述了ResLSTM和ResBLSTM先验信噪比估计器;第5节描述了实验装置,包括主客观测试程序;第6节给出了结果和讨论;第7节得出了结论。
背景
AMS语音增强框架
本文使用短时傅立叶分析、修改和合成(AMS)框架来生成增强语音。
AMS框架由三个阶段组成:(1)分析阶段,其中含噪语音进行短时傅立叶变换(STFT)分析;
(2)修改阶段,在该阶段,噪声语音STFT经过噪声失真补偿以产生修正的STFT;
(3)合成阶段,在逆STFT运算之后,通过重叠加合成来构造增强语音。
图1示出了AMS框架的框图。
图1先验信噪比
语音增强的MMSE方法利用先验信噪比计算增益函数。将增益函数应用于含噪语音的幅度谱,从而产生增强的语音幅度谱。噪声语音频谱分量的先验信噪比定义为:

上边是干净语音谱的方差,下边是噪声谱方差。
由于在语音增强过程中没有观察到干净的语音和噪声,因此必须从观测到的含噪语音中估计先验信噪比。在训练有监督学习算法估计先验信噪比时,给出了干净的语音和噪声(oracle案例)。结果,干净语音和噪声谱分量的方差分别被干净语音和噪声谱分量的平方幅值所代替。oracle案例以前被称为局部先验SNR。
MMSE approaches to speech enhancement
最小均方误差短时谱幅度(MMSE-STSA)估计器(Ephraim and Malah,1984)对干净语音的幅度谱(在均方误差(MSE)意义下)进行了优化估计。它利用给定噪声语音频谱分量的先验和后验信噪比来计算增益函数。
后验信噪比由下式给出:

最近流行的理想比率掩码(IRM)(Chen和Wang,2017)是根据给定的干净语音和噪声计算的平方根WF(SRWF)方法增益函数(Lim和Oppenheim,1979):

深度学习方法在图像恢复领域中的调查结果显示,深度学习模型已成为目前最先进的图像恢复方法之一。深度学习模型的优势在于其学习能力和自动化特性。 首先,深度学习模型对于图像恢复任务的学习能力更强。深度学习模型通常基于深层神经网络,其具有多个层级的非线性变换,可以从大量数据中学习图像的特征和统计规律。这使得深度学习模型能够更准确地恢复损坏的图像,例如去噪、超分辨率恢复和图像修复等任务。 其次,深度学习模型的自动化特性使得图像恢复变得更加便捷。相较于传统的人工设计特征提取和手动调整参数的方法,深度学习模型可以通过端到端的训练,以更少的人工干预来完成图像恢复任务。这使得深度学习模型在实际应用中更易于使用和扩展。 在图像恢复领域,深度学习模型的发展也面临一些挑战。首先,深度学习模型的训练需要大量的标注数据,而获取高质量的标注数据是昂贵且耗时的。因此,如何有效地利用有限的标注数据进行深度学习模型的训练是一个重要的问题。 其次,深度学习模型的计算复杂度较高,特别是在处理大规模图像时。这导致深度学习模型在实际应用中可能会遇到计算资源和时间成本的限制。 综上所述,深度学习方法在图像恢复领域取得了显著的进展。然而,仍有一些挑战需要克服,包括标注数据的获取和深度学习模型的计算复杂度。随着技术的不断发展,深度学习模型在图像恢复领域的应用前景将更加广阔。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值