去除人声--安装和使用spleeter分离人声和背景声

本文详细记录了如何通过FFmpeg安装和配置,以及使用Spleeter库进行音频人声和背景声分离的过程,包括常见错误及解决方法,适合音视频处理初学者参考。

在实现过程中遇到了一些问题也在此记录下来,希望大家能少踩这些坑。


前言

最近处理音视频,想把音频中的人声去掉,保留背景音乐。网上说AU 有人声移除的功能,我想AU竟然如此强大,于时去下载了AU,去除人声之后,整个都没有声音了。原因可能是:原音频看起来是立体声,实际上左声道和右声道是相同的,而人声消除的原理恰恰是消除左声道与右声道相同的声音,这样一搞自然就什么声音都没了。之后发现网上有很多吐槽AU的中置声道提取 。
*‘AU的中置声道提取算法就是个垃圾’ *

就好像:需要扣掉照片的主体保留背景,结果直接拿剪子在照片中间剜个洞。


后来看到github上面有spleeter,效果比AU好多了,下面是安装使用过程

一、最后效果是什么样的

成功分离出人声和背景声

在这里插入图片描述

二、安装FFmpeg(不能跳)

注意FFmpeg这步必须安装

因为spleeter库依赖FFmpeg

1.打开官网

http://ffmpeg.org/download.html
下面以windows 64bit为例,不要点击绿色Download 标识,点击下面windows图标
在这里插入图片描述
点击第二行,进入github
在这里插入图片描述
下载win64-gpl.zip,如果下载速度太慢,半天下载不来,进入这个github加速网站
直接输入下载的网址:

https://github.com/BtbN/FFmpeg-Builds/releases

在这里插入图片描述
FFmpeg分为3个版本:Static、 Shared、 Dev
这篇博客有说明:https://www.jianshu.com/p/7ed3be01228b

下载完之后解压,进入到bin目录,看到3个文件
在这里插入图片描述
复制bin目录所在文件路径,进入下一步,设置环境变量

系统变量->选择PATH条目
在这里插入图片描述
双击->新建->将bin目录路径添加进去。
在这里插入图片描述
打开cmd命令行窗口,输入命令ffmpeg –version

在这里插入图片描述
出现ffmpeg版本信息,说明安装成功。

三、安装spleeter模块

1.通过Anaconda创建一个虚拟环境

为了程序的稳定性,建议先通过Anaconda创建一个环境专门用来运行Spleeter,命名为music,选择python3.6。
在这里插入图片描述
点击三角按钮,选择open in Terminal,进入虚拟环境,输入下面命令
注意:我刚开始创建了Python3.6的虚拟环境,结果输入下面命令不行,于时改成3.7版本,就可以了。

conda install -c conda-forge spleeter

安装完成后,窗口会自动清屏并出现一个done

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值