深度学习音乐分类_基于神经网络的音乐流派分类

最新推荐文章于 2024-06-25 10:25:06 发布

樵枫

最新推荐文章于 2024-06-25 10:25:06 发布

阅读量4k

点赞数 2

文章标签：深度学习音乐分类

本文链接：https://blog.csdn.net/weixin_35916239/article/details/111969173

版权

本文探讨使用神经网络进行音乐类型分类，重点在于深度学习在声音处理中的应用。作者通过获取和预处理GTZAN和MSD数据集，利用Mel频率倒谱系数（MFCC）提取特征，并构建卷积神经网络进行分类。结果显示，虽然CNN表现一般，但通过增加特征提取可以提升模型性能。

摘要由CSDN通过智能技术生成

介绍本文讨论神经网络对声音样本的音乐类型进行分类的任务。当我决定在声音处理领域工作时，我认为声音类型分类和图像分类是相同的问题。但是图像非常火热，我并没有找到太多关于深度学习来解决这个问题的相关资料。直到最近我找到一个关于使用深度学习技术的基于内容的音乐推荐。他们获取数据集的方式以及他们对声音所做的预处理确实启发了我，所以我决定用深度学习来对音乐流派进行分类。这个项目的一个子任务是学习一个新的深度学习SDK，该项目在Python中实现，机器学习部分使用TensorFlow。数据集

获取数据集可能是这项工作中最耗时的部分。寻找音乐数据是一件很痛苦的事，每个文件通常是几MB，有各种各样的质量和录音参数(频率数，每秒比特数等)。但最大的痛苦是版权，没有合法的着名歌曲数据集，因为它们会花钱。目前使用的开源数据集是GTZAN的数据集。这个数据集很小(每种类型100首歌曲X 10种类型=总共1,000首歌曲)，版权许可是有问题的。从我的角度来看，这是阻碍他取得更好成绩的原因之一。所以我想要生成更多数据来学习。最终我找到了MSD数据集(Million Song Dataset)。它是一个免费提供的音频功能数据的集合，共收集一百万当代流行音乐曲目。大约280GB的纯元数据。在MSD之上有一个名为tagtraum的项目，它将MSD歌曲分类为流派。现在的问题是获得声音本身，这里是我有点创意的地方。我发现每首歌在数据集中都有一个标签是来自名为7Digital的提供商的id。7Digital是音乐应用程序的SaaS提供商，它基本上可以让您流式传输音乐。所以我编写了“previewDownloader.py”，为MSD数据集中的每首歌下载30秒预览。我将其分为以下几类：蓝调

古典

国家

迪斯科

嘻哈

爵士乐

金属

流行的

最低0.47元/天解锁文章

樵枫

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
深度学习音乐分类_基于神经网络的音乐流派分类

介绍本文讨论神经网络对声音样本的音乐类型进行分类的任务。当我决定在声音处理领域工作时，我认为声音类型分类和图像分类是相同的问题。但是图像非常火热，我并没有找到太多关于深度学习来解决这个问题的相关资料。直到最近我找到一个关于使用深度学习技术的基于内容的音乐推荐。他们获取数据集的方式以及他们对声音所做的预处理确实启发了我，所以我决定用深度学习来对音乐流派进行分类。这个项目的一个子任务是学习一个新的深度...
复制链接

扫一扫