人声抑制 深度学习_一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法与流程...

本发明涉及电子设备语音降噪技术领域,更具体地说,涉及一种融合骨振动传感器和麦克风信号的深度学习降噪方法。

背景技术:

语音降噪技术是指从带噪语音信号中分离出语音信号,该技术拥有广泛的应用,通常有单麦克风降噪技术和多麦克风降噪技术,然而传统的降噪技术中存在一些缺陷,传统的单麦克风降噪技术预先假设噪声为平稳噪声,适应性不高,局限较大;而传统的多麦克风降噪技术需要两个及以上的麦克风,增加了成本,多麦克风结构对于产品的结构设计要求更高,限制了产品的结构设计,而且,多麦克风降噪技术依靠方向信息进行降噪,无法抑制来自目标人声方向的噪音,以上缺陷值得改进。

传统多麦克风和单麦克风通话降噪技术存在以下缺陷:

1.麦克风数量与成本呈线性关系,麦克数量越多,成本越高;

2.多麦克风对产品结构设计要求更高,限制产品的结构设计;

3.多麦克降噪技术依靠方向信息进行降噪,无法抑制来自于接近目标人声方向的噪音;

4.单麦克风降噪技术依赖噪声估计,其预先架设噪声为平稳声,具有局限性。

本发明结合了骨震动传感器及传统麦克风的信号,采用深度学习进行融合从而实现降噪,在各种噪声环境下,实现提取目标人声,降低干扰噪声。该技术可应用于耳机、手机等贴合耳部(或其它身体部位)的通话场景。相比于仅采用一个或多个麦克风降噪的技术,结合骨振动传感器可在信噪比极低的环境下,诸如:地铁、风噪等场景,依然可以保持良好的通话体验。相比传统单麦克风降噪技术,本技术不对噪声做任何假设(传统单麦风降噪技术预先假设噪声为平稳噪声),利用深度神经网络强大的建模能力,有很好的人声还原度及极强的噪声抑制能力,可以在解决复杂噪声场景下人声提取问题。相比于传统多麦克风降噪技术需要2个及以上麦克风进行波束形成的降噪方案,我们采用单麦克风。

相对于气导麦克风,骨振动传感器信号采样主要在低频范围,但不受气导噪声干扰。不同于其他结合骨震动传感器及气导麦克风降噪方式仅利用骨震动传感器信号作为人声激活检测的标志,本技术将骨传导信号作为低频输入信号,通过高频重建(可选)后,与麦克风信号一同送入深度神经网络进行整体融合后实现降噪。借助骨振动传感器,我们能够得到优质的低频信号,并以此为基础,极大地提高深度神经网络预测的准确性,使得降噪效果更佳。

相比申请号为201710594168.3的专利(名称为一种通用的单声道实时降噪方法),本发明引入了骨振动传感器信号,利用骨振动传感器不受空气噪音干扰的特性,将骨振动传感器信号与气导麦克风信号使用深度神经网络融合,达到了在极低信噪比下也能有优质的降噪效果。

相比申请号为201811199154.2的专利(名称为一种通过人体振动识别用户语音以控制电子设备的系统)中将骨振动传感器信号作为语音活动检测的标志不同,我们将骨振动传感器信号与麦克风信号一起作为深度神经网络的输入,进行信号层的有机融合,从而达到优质的降噪效果。

技术实现要素:

本发明要解决的技术问题在于如何通过采用一种融合骨振动传感器和麦克风信号的深度学习降噪方法,以解决现有技术中多麦克风限制产品结构、成本过高、而且传统的单麦克风降噪技术有局限性等问题。不同于其他结合骨震动传感器和气导麦克风技术中仅利用骨震动传感器信号作为激活检测的标志,本技术利用骨振动传感器信号不受气导噪声干扰的特性,将骨传信号作为直接输入信号,通过高频重建(可选)后,与麦克风信号一同送入深度神经网络进行整体融合及降噪。借助骨振动传感器,我们能够得到优质的低频信号,并以此为基础,极大地提高深度神经网络预测的准确性&

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值