python语音特征提取之使用ffmpeg与spleeter实现视频人声过滤

weixin_44253169

于 2020-12-14 18:36:24 发布

阅读量8.3k

点赞数 8

分类专栏： python 文章标签： python 深度学习 tensorflow ffmpeg 视频处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44253169/article/details/111152524

版权

本文介绍了如何利用Python中的moviepy、ffmpeg和spleeter库来处理视频，实现视频与音频的分离，特别是人声与背景声的分离。详细步骤包括安装所需库、配置环境、分离音频和视频流，以及处理可能出现的错误。同时，针对tensorflow版本问题，给出了安装旧版tensorflow的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

安装过程中所涉及到的库有两种安装方式：通过pip或者conda安装。本次测试通过pip安装，使用镜像为清华源和豆瓣源。

安装moviepy

moviepy包是一个用来处理视频的库。这个库是Python视频编辑库，可裁剪、拼接、标题插入、视频合成、视频处理和自定义效果。
1.使用pip install moviepy安装，报错
在这里插入图片描述
2.使用豆瓣镜像下载

pip install moviepy -i http://pypi.douban.com/simple --trusted-host=pypi.douban.com

在这里插入图片描述

安装ffmpeg

1.去官网下载ffmpeg（windows版本），并解压（解压到压缩文件名的文件夹）
2.在windows上配置系统环境变量Path
3.pip install ffmpeg-python

安装spleeter库

1.直接安装：

pip install --user spleeter

2.豆瓣镜像：

pip install --user spleeter -i https://pypi.doubanio.com/simple

3.不再手动训练，直接使用官方预测模型。目前spleeter提供三种音轨分离方式，其中：

Vocals (singing voice) / accompaniment separation (2 stems) —两个音轨：背景和人声
Vocals /drums / bass / other separation (4 stems) —四个音轨
Vocals / drums / bass /piano / other separation (5 stems)—五个音轨

可以自由选择。本次选择2stems模型进行背景与人声分离，手动下载安装过程如下：

github下载2stems.tar.gz
https://github.com/deezer/spleeter/releases

最低0.47元/天解锁文章

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。