去除人声--安装和使用spleeter分离人声和背景声

原创

已于 2022-05-06 20:45:55 修改 · 1.8w 阅读

·

18

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2022-05-06 20:41:09 首次发布

本文详细记录了如何通过FFmpeg安装和配置，以及使用Spleeter库进行音频人声和背景声分离的过程，包括常见错误及解决方法，适合音视频处理初学者参考。

在实现过程中遇到了一些问题也在此记录下来，希望大家能少踩这些坑。

文章目录

前言
一、最后效果是什么样的
二、安装FFmpeg（不能跳）
- 注意FFmpeg这步必须安装
- 1.打开官网
三、安装spleeter模块
四、使用spleeter分离人声和背景声
- 错误示范
总结

前言

最近处理音视频，想把音频中的人声去掉，保留背景音乐。网上说AU 有人声移除的功能，我想AU竟然如此强大，于时去下载了AU，去除人声之后，整个都没有声音了。原因可能是：原音频看起来是立体声，实际上左声道和右声道是相同的,而人声消除的原理恰恰是消除左声道与右声道相同的声音,这样一搞自然就什么声音都没了。之后发现网上有很多吐槽AU的中置声道提取。
*~~‘AU的中置声道提取算法就是个垃圾’~~ *

就好像：需要扣掉照片的主体保留背景，结果直接拿剪子在照片中间剜个洞。

后来看到github上面有spleeter，效果比AU好多了，下面是安装使用过程

一、最后效果是什么样的

成功分离出人声和背景声

在这里插入图片描述

二、安装FFmpeg（不能跳）

注意FFmpeg这步必须安装

因为spleeter库依赖FFmpeg

1.打开官网

http://ffmpeg.org/download.html
下面以windows 64bit为例，不要点击绿色Download 标识，点击下面windows图标
在这里插入图片描述
点击第二行，进入github

下载win64-gpl.zip，如果下载速度太慢，半天下载不来，进入这个github加速网站
直接输入下载的网址：

https://github.com/BtbN/FFmpeg-Builds/releases

在这里插入图片描述
FFmpeg分为3个版本：Static、 Shared、 Dev
这篇博客有说明：https://www.jianshu.com/p/7ed3be01228b

下载完之后解压，进入到bin目录，看到3个文件
在这里插入图片描述
复制bin目录所在文件路径，进入下一步，设置环境变量

系统变量->选择PATH条目
在这里插入图片描述
双击->新建->将bin目录路径添加进去。

打开cmd命令行窗口，输入命令ffmpeg –version

在这里插入图片描述
出现ffmpeg版本信息，说明安装成功。

三、安装spleeter模块

1.通过Anaconda创建一个虚拟环境

为了程序的稳定性，建议先通过Anaconda创建一个环境专门用来运行Spleeter，命名为music，选择python3.6。
在这里插入图片描述
点击三角按钮，选择open in Terminal,进入虚拟环境,输入下面命令
注意：我刚开始创建了Python3.6的虚拟环境，结果输入下面命令不行，于时改成3.7版本，就可以了。

conda install -c conda-forge spleeter

安装完成后，窗口会自动清屏并出现一个done

最低0.47元/天解锁文章

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。