从零搭建音乐识别系统（一）整体功能介绍

胖胖大海

已于 2023-07-28 08:50:17 修改

阅读量1.1k

点赞数 1

分类专栏：度量学习深度学习 DML 文章标签：音乐识别

于 2022-01-08 22:12:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cxx654/article/details/122387228

版权

深度学习同时被 3 个专栏收录

83 篇文章 5 订阅

订阅专栏

13 篇文章 12 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

从零搭建音乐识别系统（一）整体功能介绍_程大海的博客-CSDN博客

从零搭建音乐识别系统（二）音频特征提取_程大海的博客-CSDN博客_音乐特征提取

从零搭建音乐识别系统（三）音乐分类模型_程大海的博客-CSDN博客

从零搭建音乐识别系统（四）embedding特征提取模型_程大海的博客-CSDN博客

从零搭建音乐识别系统（五）embedding特征提取模型验证_程大海的博客-CSDN博客

代码地址：https://github.com/xxcheng0708/AudioEmbeddingExtraction

从零开始搭建一个音乐识别系统总共分几步，简单画了一个草图：

总结一下，大概分为以下四步：

1、训练一个分类模型，用于识别一段音乐是否是音乐，如果是音乐才继续进行识别，如果不是音乐则停止识别，这可以带来两个方面的好处。一是可以降低一定的计算量；二是可以降低误识别

2、使用度量学习相关方法，训练一个提取音乐片段embedding向量的模型，理想情况下，相似的歌曲片段的embedding之间具有更高的相似度，从而可以根据embedding相似度进行识别

3、基于训练好的分类模型和embedding特征模型，把需要识别的歌曲文件都转换成对应的embedding特征向量，构成一个歌曲的embedding特征库

4、对于一个新的歌曲片段，使用分类模型和embedding特征模型提取embedding特征向量，然后和特征库中保存的embedding所有特征向量之间进行相似度匹配，返回满足相似度阈值的识别结果。

在后续博客中，会依次介绍歌曲文件预处理、梅尔频谱特征提取、分类模型训练、embedding特征提取模型训练、embedding向量库构建、向量库检索，以及在模型训练中遇到的一些问题。

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
从零搭建音乐识别系统（一）整体功能介绍

从零开始搭建一个音乐识别系统总共分几步，简单画了一个草图：总结一下，大概分为以下四步：1、训练一个分类模型，用于识别一段音乐是否是音乐，如果是音乐才继续进行识别，如果不是音乐则停止识别，这可以带来两个方面的好处。一是可以降低一定的计算量；二是可以降低误识别2、使用度量学习相关方法，训练一个提取音乐片段embedding向量的模型，理想情况下，相似的歌曲片段的embedding之间具有更高的相似度，从而可以根据embeddi......
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。