【音频分离】demucs V3的环境搭建及训练（window）

最新推荐文章于 2024-08-25 07:56:16 发布

4576号菜鸟

最新推荐文章于 2024-08-25 07:56:16 发布

阅读量5k

点赞数 6

分类专栏： # 音频分离文章标签： python 人工智能音频分离

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46319397/article/details/131726200

版权

文章目录

一、环境搭建
二、数据集准备
报错
写在最后

这是一个音频提取、分离的项目

一、环境搭建

（1）新建虚拟环境，并进入

conda create -n demucs python=3.8
activate demucs

在这里插入图片描述

（2）安装pyTorch

到pyTorch官网选择对应配置
在这里插入图片描述

这个是我的配置

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

在这里插入图片描述

（3）进入代码文件夹，批量安装包

在这里插入图片描述

d:
cd  D:\data\cqZhang\demucs-3
pip install -r requirements.txt

在这里插入图片描述

（4）安装其他需要的包

pip install librosa

二、数据集准备

（1）下载数据集

使用Musdb HQ 数据集
获取路径有：
https://zenodo.org/record/3338373
https://www.kaggle.com/datasets/ayu055/musdb18hq

数据集可以放在“\checkpoint\defossez\datasets\musdbhq”路径下，
这与代码原来的位置应该是一致的

（2）修改配置参数

The dset.musdb key inside conf/config.yaml.
The variable MUSDB_PATH inside tools/automix.py.

在这里插入图片描述

我本来使用的是相对路径，但是他貌似找不到，后来改成绝对路径
其他的路径也一样，如果找不到，就要改成绝对路径

（3）创建微调数据集

原来的命令是export NUMBA_NUM_THREADS=1; python3 -m tools.automix，但它是linux上的命令，
将其改为set NUMBA_NUM_THREADS=1 && python -m tools.automix

运行结束会在项目目录下产生tmp文件夹，里面有新的数据集

修改 conf/config.yaml.中的 dset.musdb
修改 conf/dset/auto_mus.yaml 中的 dset.wav （ OUTPATH）

（4）解压outputs.tar.gz

tar xvf outputs.tar.gz

在这里插入图片描述

三、训练

训练有三种命令
我只尝试了第二种

（1）默认，cpu

dora info -f 81de367c

this will show the hyper-parameter used by a specific XP.
Be careful some overrides might present twice, and the right most one will give you the right value for it.
这将显示特定XP使用的超参数。
请注意，有些覆盖可能会出现两次，最正确的一次将为您提供正确的值。

最低0.47元/天解锁文章

博客等级

码龄5年

62
原创

169
点赞

1075
收藏

4660
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 【InsCode Stable Diffusion 美图活动一期】生成着玩

最新评论

中文论文翻译成英文投稿国外期刊的小tips
WordviceChina: 欢迎博主有空再来试试 Wordvice AI 网站哦！和作者提及的DeepL, grammarly, quilltbot等线上翻译器一样，Wordvice AI 在线翻译性能也非常优秀。除了“翻译”，兼顾 “语法检查纠错” “改写降重润色” “总结” “查重” “查文本AI率”等功能！ ● 在线翻译：线上支援多种语言即时翻译，帮助突破语言障碍，支持40多种语言。 ● 语法检查：提供轻微/标准/深度/简洁4种编辑模式，校对纠错更精准，支持12种语言。（轻微, 标准, 深度, 简洁 4种模式） ● 改写润色：使用不同的专业语气改写句子，提升可读性，支持12种语言。（流畅，学术，专业正式，专业友好，创意 5种模式） ● 总结摘要：迅速掌握文章重点，Key points 一目了然，支持12种语言。 ● 在线查重：线上即时检查相似度，帮助提早防范抄袭问题。 ● AI内容检测：快速检查文本是由人工编写而成还是由ChatGPT或Gemini等AI工具创建而成。 - 有需要外文写作时，使用“翻译”功能之后可以马上再移步 “语法检查纠错” 和 “改写降重润色” 功能页面去调整译文，以让译文更加流畅通顺，质量得以提升。比很多写作辅助工具更有针对性，非常适合像论文这种对专业性要求高的文件~~ 免费基础版虽有使用字数限制，但常用功能可随时试用~ 有需要还可以联系我给您开通高级版的试用权限~~
【问卷分析】调节效应检验的操作②
2401_90073642: 请问作者具体该怎么去绘制表格，哪些数据需要报告可以再详细一些说明一下。感恩！
【音频分离】demucs V3的环境搭建及训练（window）
weixin_68377312: 可以问一下训练这个模型大概要跑多少时间吗？谢谢
中文论文翻译成英文投稿国外期刊的小tips
qq_57369551: 语态问题学术论文除表达作者个人见解外，大量篇幅用于描述实验过程和观察的结果，此时应该站在中立客观的角度来简述事实，因此前言和材料与方法部分中尽量采用被动语态。其它部分如摘要、结果和讨论，可以灵活使用被动语态或主动语态，如「我们发现-----」，「根据我们的观察，我们建议-----」。
使用Xmanager 7连接centos7远程桌面
不动明王呀: centos7 systemctl start lightdm 之后黑屏

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

4576号菜鸟 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。