论文解读
shaobo Huang
化繁为简,高效极致
展开
-
Harvest: A high-performance fundamental frequency estimator from speech signals
描述了一个名为 Harvest 的基频(F0)估计器。Harvest的独特之处在于,它可以获得可靠的 F0 轮廓,并减少了将有声部分错误地识别为清音部分的错误。它包括两个步骤:估计 F0 候选值,并根据这些候选值生成可靠的 F0 轮廓。第一步,该算法利用许多中心频率不同的带通滤波器提取基本成分,并从滤波后的信号中获得基本的 F0 候选值。之后,通过使用瞬时频率对基本的 F0 候选进行精炼和...原创 2019-12-23 18:09:55 · 1071 阅读 · 0 评论 -
Sound quality comparison among high-quality vocoders by using re-synthesized speech
使用重新合成的语音比较高质量声码器之间的音质介绍语音分析/合成系统已用于各种应用中,例如语音转换[1]和统计参数语音合成[2]。这些应用程序使用基于声码器[3]的高质量系统,而 STRAIGHT [4]是最好的系统之一。在本文中,“声码器”是指语音分析/合成系统,高质量的声码器可将语音波形准确地分解为基本频率(fo),频谱包络和非周期性。近年来,我们提出了一种新的声码器,命名为 WOR...原创 2019-12-23 17:42:54 · 381 阅读 · 0 评论 -
Open-Unmix - A Reference Implementation for Music Source Separation
Open-Unmix-音乐源分离的参考实现摘要音乐源分离的任务是将音乐分解成其组成部分,例如,为人声,低音和鼓产生分离的茎。这样的分离具有许多应用,从重新排列/重新设置主干(重新混合,重新平移,上混合)到完全提取(卡拉 OK,样本创建,音频恢复)。音乐分离具有悠久的科学活动历史,因为众所周知这是一个非常具有挑战性的问题。近年来,基于深度学习的系统首次产生了高质量的分离,这也引起了越来越多的商业...原创 2019-12-17 12:30:29 · 1400 阅读 · 0 评论 -
近期语音论文概览
《Voice Activity Detection: Merging Source and Filter-based Information》,Toshiba Cambridge Research Laboratory 这篇文章主要介绍了将声源和特征滤波的方法相结合,通过互信息的评估方法表明,这种结合了声源和特征滤波的方法显示出更加强大的判别能力,并且此方法已经达到业界最高水平的声学活动检测(VA...转载 2019-11-25 09:57:40 · 268 阅读 · 0 评论 -
WAVE-U-NET: A MULTI-SCALE NEURAL NETWORK FOR END-TO-END AUDIO SOURCE SEPARATION
文章链接:WAVE-U-NET原创 2019-11-25 12:26:28 · 4191 阅读 · 0 评论 -
Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis
论文PDF版Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesisabstract文中介绍了一种多说话人的语音合成系统(TTS),可以合成不在训练集合中的说话人声音,包括在train的时候没有见过的。该系统包含了三个部分。a speaker encoder net: 在数千...原创 2019-11-21 10:11:48 · 1165 阅读 · 0 评论