检测带人声的音乐

部分文献的结果:

印度古典乐的几种简单乐器的演奏,谱减法消去部分背景音初步处理,区分结果:


前提已知-音乐的曲调,消去部分背景音,实验结果:


针对各类复杂的流行音乐,自己实验的结果:

1120首10折交叉验证的准确率是87.2%
5000首10折交叉验证的准确率是86.40%  耗时 15个小时
截取中间3分钟
5000首10折交叉验证的准确率是86.33%  耗时 10个小时
无重叠帧处理
5000首10折交叉验证的准确率是86.42%  耗时 5个小时, 平均处理1个文件3.6s


人声分离是一种将人声与背景音乐分开的技术。目前流行的人声分离算法有: 1. 基于卷积神经网络的方法,如 U-Net、DeepConvSep、Deep Speaker-aware Network 等。 2. 基于长短期记忆(LSTM)的方法,如 LSTM-based Audio Source Separation、LSTM-based Single-channel Audio Separation 等。 3. 基于隐马尔可夫模型(HMM)的方法,如 HMM-based Audio Separation、HMM-based Audio Source Separation 等。 4. 基于注意力机制的方法,如 Attention-based Audio Source Separation、Attention-based Audio Separation 等。 5. 基于协同过滤(CF)的方法,如 CF-based Audio Separation、CF-based Audio Source Separation 等。 6. 基于约束的方法,如 Constraint-based Audio Separation、Constraint-based Audio Source Separation 等。 7. 基于多源信息熵的方法,如 Multi-source Information Entropy-based Audio Separation、Multi-source Information Entropy-based Audio Source Separation 等。 8. 基于声纹识别的方法,如 Speaker Recognition-based Audio Separation、Speaker Recognition-based Audio Source Separation 等。 9. 基于语音增强的方法,如 Speech enhancement-based Audio Separation、Speech enhancement-based Audio Source Separation 等。 10. 基于二进制分类的方法,如 Binary Classification-based Audio Separation、Binary Classification-based Audio Source Separation 等。 11. 基于深度学习的方法,如 Deep Learning-based Audio Separation、Deep Learning-based Audio Source Separation 等。 12. 基于非负矩阵分解(NMF)的方法,如 NMF-based Audio Separation、NMF-based Audio Source Separation 等。 13. 基于独立成分分析(ICA)的方法,如 ICA-based Audio Separation、ICA-based Audio Source Separation 等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值