语音分离
声源分离
shaobo Huang
化繁为简,高效极致
展开
-
使用GMM进行语音性别检测(入门)
可以从语音样本中提取很多信息,例如,说话者是谁,说话者的性别是什么,说话的语言是什么,说话者说出的句子有什么情感,数字对话中的说话者等。在机器学习的语音分析领域,性别检测可能是最基本的任务。这篇博客文章致力于通过语音性别检测的Python实现进入语音处理领域。数据集:可以从此处下载以下数据集。训练语料库:训练语料库:它是根据YouTube视频开发而成的,每个性别的演讲时间为5分钟,由5位不同的男性和5位女性演讲者(即1分钟/演讲者)讲。测试语料库: 它 摘自 Google今年(2017年)最近.转载 2020-08-10 11:23:46 · 2978 阅读 · 1 评论 -
分离歌曲中的人声和背景音乐(tensorflow)
有没有好奇歌星们清唱的声音怎么样?这一讲,我们将歌曲的人声和背景音乐分离出来,使用的网络是RNN。接下来一一讲解怎么实现。下载数据集搞机器学习,首先想到的是怎么获取训练的数据,网上有开放的数据集MIR-1k,下载地址如下:http://mirlab.org/dataset/public/MIR-1K.rar下载完数据,解压到dataset/下,结构如下图所示数据集里有很多文件夹,其他的...原创 2019-12-09 19:49:48 · 11870 阅读 · 35 评论 -
Open-Unmix - A Reference Implementation for Music Source Separation
Open-Unmix-音乐源分离的参考实现摘要音乐源分离的任务是将音乐分解成其组成部分,例如,为人声,低音和鼓产生分离的茎。这样的分离具有许多应用,从重新排列/重新设置主干(重新混合,重新平移,上混合)到完全提取(卡拉 OK,样本创建,音频恢复)。音乐分离具有悠久的科学活动历史,因为众所周知这是一个非常具有挑战性的问题。近年来,基于深度学习的系统首次产生了高质量的分离,这也引起了越来越多的商业...原创 2019-12-17 12:30:29 · 1330 阅读 · 0 评论 -
WAVE-U-NET: A MULTI-SCALE NEURAL NETWORK FOR END-TO-END AUDIO SOURCE SEPARATION
文章链接:WAVE-U-NET原创 2019-11-25 12:26:28 · 4149 阅读 · 0 评论 -
spleeter分离伴奏和人声
近日,Deezer开源了一个名为Spleeter项目,该项目利用深度学习对音乐曲目进行源分离。它使用Keras和TensorFlow构建,Spleeter可以帮助音乐信息检索(MIR)领域的研究机构,充分利用最先进的源分离算法的强大功能,它以基于Tensorflow的Python库的形式出现,包含针对2、4和5个词干分隔的预训练模型。什么是源分离?音乐录音通常是几个单独乐器音轨的组合(主音,鼓...原创 2019-11-11 15:07:02 · 11891 阅读 · 17 评论