DDSP翻唱歌曲

stay or leave

已于 2023-05-26 19:29:23 修改

阅读量304

点赞数

分类专栏： AI翻唱文章标签：笔记

于 2023-05-25 22:06:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_48489427/article/details/130875872

版权

AI翻唱专栏收录该内容

1 篇文章 0 订阅

订阅专栏

数据集的准备

第一个渠道是歌曲：

在网易云下载音乐，下载后的音乐格式为ncm，需要将ncm格式转换为mp3格式。
对mp3格式的音乐进行去除伴奏和和音等，保留其纯净的人声，我使用的工具是UVR5（链接：），需要对同一首音乐进行两次提取，第一次提取是为了去除伴奏，第二次提取是为了去除和音等，两次提取对UVR5工具参数设置如下。
在提取人声之后，音乐里面还会包含空白的片段，这回影响模型的训练效果，所以需要进行切片的操作，以切除空白的片段。切片的界面如下。
以上操作顺利完成后，就能从音乐中切除人声片段了。

第二个渠道是演讲：

操作步骤和渠道是音乐是一样的，但要注意去除非目标人声的其他人声。

模型的训练

模型的推理界面如下。
对DDSP模型训练参数的解释：对于椭圆参数，若报错显存不足，则向下调整。对于矩形参数，2000代表每训练2000个step（应该是batch_size）后，保存训练得到的权值文件，并且计算该权值文件在验证机上的损失。
对于扩散模型训练参数解释：对于椭圆参数，若报错显存不足，则向下调整。对于矩形参数，2000代表每训练2000个step（应该是batch_size）后，保存训练得到的权值文件，并且计算该权值文件在验证机上的损失。对于菱形参数，若batch_size已经较小时，显存不足的问题还是出现，则关闭缓存功能，可有效解决该问题。

模型的推理

注意，如果推理的过程中爆显存，应该就是待推理的音乐时长太长（从bilibili原作者视频下面的评论学到的）。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DDSP翻唱歌曲

模型的训练模型的推理。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。