基于声纹识别的语音分离 VOICE FILTER: TARGETED VOICE SEPARATION (BY SPEAKER-CONDITIONED SPECTROGRAM MASKING)
原文连接:https://arxiv.org/pdf/1810.04826.pdf结果连接: https://google.github.io/speaker-id/publications/VoiceFilter摘要在这篇文章中,我们提出了一个通过参考音频实现音频分离的系统。我们通过两个独立的网络来实现这个目的。(1)声纹识别网络用于生成离散的发音者特征。(2)谱掩码网络:通过输入说话者特征和噪声谱,生成一个谱掩码。我们的系统显著降低了语音识别在多人混杂 语音上的词错误率,在单人干净语...
转载
2020-08-11 15:19:42 ·
3792 阅读 ·
0 评论