语音增强研究现状与趋势分析

本文主要的参考文献来自于语音及语言信息处理国家工程实验室的一篇演讲报告


1、语音增强的目标:

受体是机器,目标是提高语音的可懂度(intelligibility)

受体是人,目标是提高语音的质量(quality)


2、语音增强的任务:

语音降噪、语音分离、语音解混响,增强技术很多情况下并不是独立的,而是需要联合处理和优化。例如,语音解混
响与降噪,卷积盲源分离与降噪等等


3、研究现状和趋势:

语音增强主要包括三个方面:语音降噪、语音分离和语音解混响(可以包含回声消除)问题。根据接收信号的通道个数不同又分为单通道和多通道(特别强调二麦情况,因为与人类双耳对应)等不同情况。基本的算法都是从混合信号和干净信号建立的接收信号模型出发,考虑空间(spatial)、时间(temporal)和谱特性(spectra)三个维度的信息和信号处理问题;当然空间信息需要对应多麦克风情况,单麦克风没有spatial信息可以利用。

1)语音降噪研究现状

无监督语音降噪算法:

   谱减法

将估计的噪声的功率谱并将其从嘈杂语音中减去;

没有利用明确的语音模型,其性能在很大程度上叏决亍对干扰源的频谱跟踪的好坏,容易产生“无中生有”的音乐 噪声;

基于统计模型的方法

语音增强问题归入到一个统计的估计框架中,如Wiener滤波、最小均方误差(MMSE)方<

  • 5
    点赞
  • 60
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值