python把多个人声分离_Spleeter—快速分离歌曲中人声和伴奏音乐的开源AI工具

对于制作人、DJ以及任何想使用隔离音频进行演奏的人来说,将歌曲拆分为单独的人声和乐器一直是头疼的问题。目前有很多方法可以执行此操作,但是过程十分耗时,并且结果通常不完美

音乐流媒体服务Deezer为此研究开发出新的开源AI工具——Spleeter使这项棘手的任务变得更快,更轻松。该公司目前将软件以开源软件包的形式发布到Github上,可供任何人下载和使用。制作人想分离人声和乐器时,只需要提供一个音频文件,然后Spleeter就会将它分成两个、四个或五个独立的音轨。该库附带了三种预先训练的模型:

两个词干 –人声和其他伴奏四个词干 –人声,鼓,低音,其他五个词干 –人声,鼓,低音,钢琴等

虽然通过Spleeter隔离时结果在某些方面并不完美,但是Spleeter有一个重要的优点,那就是和其他软件相比Spleeter隔离音频非常快,在专用GPU上运行时,它可以将音频文件分成四个音轨,比实时快100倍。Deezer本身将Spleeter用于一系列研究应用程序,以帮助改善其流媒体服务。Herault表示“在内部,我们将其用作预处理工具,以完成诸如音乐分类,转录和语言检测之类的复杂研究任务”。

技术专家安迪·拜奥(Andy Baio)撰写了一篇有关Spleeter的技术博文,其中包含很多自己操作的例子。他说,该软件产生的人声:“有时会有机器人自动调谐的感觉,但是相对于其他解决方案而言,遗漏的数量令人震惊地低。”他还指出,Spleeter对于希望任何想创建混搭的人来说也将非常实用。对于希望将孤立的人声整合到混音中的DJ和制作人,或者对于希望创建自制卡拉OK伴奏音轨的人来说,Spleeter无疑是十分有用的。

但需要注意的是,使用者在使用时需要掌握一些技术知识,就是必须会一些专业技术。除非总是使用Python或Google的AI工具包TensorFlow(用于训练Spleeter的软件)这类的软件,否则必须下载一些程序才能让所有程序正常运行。而且,使用者必须习惯使用命令行输入(尽管非常简单),而不是更易于使用的可视化界面。

总而言之,在某种程度上,Spleeter为许多致力于声源分离的厂商提供了一个很好的研究方向。因为Spleeter确实可以实现预期的人声分离工作,虽然它并没有完全解决了人声分离问题。在这一问题上,仍然有许多工作要做。目前国内外也有许多团队在进行人声分离技术开发,打造了优秀的人声分离软件,例如iZotope RX 7的Music Rebalance、时代拓灵的720Studio等。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
ReadMe Release Version beta_1.0 index.py imageMatlab.py This is more or less a wrapper for Matplotlib imaging functions such that their behavior is equivalent, in terms of colormap, aspect and so forth, to the expected behavior of Matlab's functions. sepVocal.py This script can be used to execute the desired separation. See below for an example of use of this file. SIMM.py This script implements the actual algorithm for parameter estimation. It is mainly used by sepVocal.py. tracking.py The Viterbi decoding algorithm is implemented in this script. Requirements: These scripts have been tested with Python 2.7, The packages that are required to run the scripts are pydub,ffmepg, Numpy, Spicy, Matplotlib. One can respectively find the latest versions at the following addresses: http://pydub.com/ https://ffmpeg.org http://numpy.org/ http://scipy.org/ http://matplotlib.sourceforge.net/ Notes: Prefer recent versions of the above packages, in order to avoid compatibility issues, notably for Matplotlib. Note that this latter package is not necessary for the program to run, although you might want to watch a bit what is happening! Spicy should be version 0.8+, since we use its io.wavefile module to read the wave files. We once used the audio lab module, but it would seem that it is a bit more complicated to install (with the benefit that many more file formats are allowed). Usage: The easy way to use these scripts is to run the exec package of our release version: http://www.github.com/beata_1.0 for more develop: you can run the index.py on pycharm directly. note: the output files will create under you source wav file. ContactMe Email:xlzhang14@fudan.edu.cn

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值