语音分离
一片橡树叶子的故事
这个作者很懒,什么都没留下…
展开
-
一文读懂深度学习中的语音分离技术
由于语音分离已经变成分类问题,所以语音分离也变得非常重要,已经在信号处理领域被研究了几十年,数据驱动的方法在语音处理领域也得到了广泛研究。 语音分离的目标是把目标语音从背景干扰中分离出来。在信号处理中,语音分离属于很基本的任务类型,应用范围很广泛,包括听力假体、移动通信、鲁棒的自动语音以及说话人识别。人类听觉系统能轻易地将一个人的声音和另一个人的分离开来。即使在鸡尾酒会那样的声音环境中,我们似乎也能毫不费力地在其他人的说话声和环境噪声的包围中听到一个人的说话内容。因此语音分离问题通常也被叫做「鸡尾酒会转载 2020-08-11 15:22:27 · 7613 阅读 · 0 评论 -
基于声纹识别的语音分离 VOICE FILTER: TARGETED VOICE SEPARATION (BY SPEAKER-CONDITIONED SPECTROGRAM MASKING)
原文连接:https://arxiv.org/pdf/1810.04826.pdf结果连接: https://google.github.io/speaker-id/publications/VoiceFilter摘要在这篇文章中,我们提出了一个通过参考音频实现音频分离的系统。我们通过两个独立的网络来实现这个目的。(1)声纹识别网络用于生成离散的发音者特征。(2)谱掩码网络:通过输入说话者特征和噪声谱,生成一个谱掩码。我们的系统显著降低了语音识别在多人混杂 语音上的词错误率,在单人干净语...转载 2020-08-11 15:19:42 · 3792 阅读 · 0 评论