对于制作人、DJ以及任何想使用隔离音频进行演奏的人来说,将歌曲拆分为单独的人声和乐器一直是头疼的问题。目前有很多方法可以执行此操作,但是过程十分耗时,并且结果通常不完美
音乐流媒体服务Deezer为此研究开发出新的开源AI工具——Spleeter使这项棘手的任务变得更快,更轻松。该公司目前将软件以开源软件包的形式发布到Github上,可供任何人下载和使用。制作人想分离人声和乐器时,只需要提供一个音频文件,然后Spleeter就会将它分成两个、四个或五个独立的音轨。该库附带了三种预先训练的模型:
两个词干 –人声和其他伴奏四个词干 –人声,鼓,低音,其他五个词干 –人声,鼓,低音,钢琴等
虽然通过Spleeter隔离时结果在某些方面并不完美,但是Spleeter有一个重要的优点,那就是和其他软件相比Spleeter隔离音频非常快,在专用GPU上运行时,它可以将音频文件分成四个音轨,比实时快100倍。Deezer本身将Spleeter用于一系列研究应用程序,以帮助改善其流媒体服务。Herault表示“在内部,我们将其用作预处理工具,以完成诸如音乐分类,转录和语言检测之类的复杂研究任务”。
技术专家安迪·拜奥(Andy Baio)撰写了一篇有关Spleeter的技术博文,其中包含很多自己操作的例子。他说,该软件产生的人声:“有时会有机器人自动调谐的感觉,但是相对于其他解决方案而言,遗漏的数量令人震惊地低。”他还指出,Spleeter对于希望任何想创建混搭的人来说也将非常实用。对于希望将孤立的人声整合到混音中的DJ和制作人,或者对于希望创建自制卡拉OK伴奏音轨的人来说,Spleeter无疑是十分有用的。
但需要注意的是,使用者在使用时需要掌握一些技术知识,就是必须会一些专业技术。除非总是使用Python或Google的AI工具包TensorFlow(用于训练Spleeter的软件)这类的软件,否则必须下载一些程序才能让所有程序正常运行。而且,使用者必须习惯使用命令行输入(尽管非常简单),而不是更易于使用的可视化界面。
总而言之,在某种程度上,Spleeter为许多致力于声源分离的厂商提供了一个很好的研究方向。因为Spleeter确实可以实现预期的人声分离工作,虽然它并没有完全解决了人声分离问题。在这一问题上,仍然有许多工作要做。目前国内外也有许多团队在进行人声分离技术开发,打造了优秀的人声分离软件,例如iZotope RX 7的Music Rebalance、时代拓灵的720Studio等。