音源分离 | Hybrid Spectrogram and Waveform Source Separation

最新推荐文章于 2025-06-10 19:55:42 发布

孤独的追光者

最新推荐文章于 2025-06-10 19:55:42 发布

阅读量877

点赞数 6

分类专栏：笔记文章标签：人工智能音频算法深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cash_cp/article/details/138861338

版权

一、摘要

本文提出了基于Demucs架构的的时域+频域的分离模型。提出的模型在2021年索尼组织的音乐分离挑战中获胜。该架构还包括其他改进，如压缩残差分支、局部注意力或奇异值正则化。

在MusDB HQ数据集上，所有源的信噪比（SDR）平均提高了1.4 dB，这一改进得到了人类主观评估的确认，整体质量评分为2.83分（非混合Demucs为2.36分），污染程度评分为3.04（非混合Demucs为2.37，比赛中排名第二的模型为2.44）。

二、方法

2.1 引言

音乐源分离的研究集中在将鼓、贝斯、人声和其他伴奏分离的监督方式上。2021年索尼组织的音乐分离挑战（MDX）提供了一个新的在线比赛平台，用于评估分离模型在未知测试集上的表现。

2.2 方法

本研究扩展了Demucs架构，以执行混合波形、频谱域源分离。模型包括时间域和频率域的并行分支，并引入了压缩残差分支、局部注意力和奇异值正则化等改进。这些改进在MusD

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。