基于神经网络的音乐流派分类

介绍

本文讨论神经网络对声音样本的音乐类型进行分类的任务。当我决定在声音处理领域工作时,我认为声音类型分类和图像分类是相同的问题。但是图像非常火热,我并没有找到太多关于深度学习来解决这个问题的相关资料。直到最近我找到一个关于使用深度学习技术的基于内容的音乐推荐。他们获取数据集的方式以及他们对声音所做的预处理确实启发了我,所以我决定用深度学习来对音乐流派进行分类。这个项目的一个子任务是学习一个新的深度学习SDK,该项目在Python中实现,机器学习部分使用TensorFlow。

数据集

获取数据集可能是这项工作中最耗时的部分。寻找音乐数据是一件很痛苦的事,每个文件通常是几MB,有各种各样的质量和录音参数(频率数,每秒比特数等)。但最大的痛苦是版权,没有合法的着名歌曲数据集,因为它们会花钱。目前使用的开源数据集是GTZAN的数据集。这个数据集很小(每种类型100首歌曲X 10种类型=总共1,000首歌曲),版权许可是有问题的。从我的角度来看,这是阻碍他取得更好成绩的原因之一。所以我想要生成更多数据来学习。最终我找到了MSD数据集(Million Song Dataset)。它是一个免费提供的音频功能数据的集合,共收集一百万当代流行音乐曲目。大约280GB的纯元数据。在MSD之上有一个名为tagtraum的项目,它将MSD歌曲分类为流派。现在的问题是获得声音本身,这里是我有点创意的地方。我发现每首歌在数据集中都有一个标签是来自名为7Digital的提供商的id。7Digital是音乐应用程序的SaaS提供商,它基本上可以让您流式传输音乐。所以我编写了“previewDownloader.py”,为MSD数据集中的每首歌下载30秒预览。我将其分为以下几类:

  • 蓝调

  • <
  • 7
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
音乐流派分类是一个非常有趣的问题,可以使用MFCC和GMM来实现。MFCC是一种用于音频信号特征提取的技术,可以将音频信号转换为一组与音高、音量等相关的特征向量。GMM是一种基于概率的分类器,可以用于将特征向量映射到不同的音乐流派。 下面是一个基于MFCC和GMM的音乐流派分类的Python代码示例: ```python import os import numpy as np import scipy.io.wavfile as wav from python_speech_features import mfcc from sklearn.mixture import GaussianMixture from sklearn.model_selection import train_test_split # 定义函数,提取MFCC特征 def extract_features(file_name): (rate, sig) = wav.read(file_name) mfcc_feat = mfcc(sig, rate, nfft=2048) return mfcc_feat # 定义函数,加载数据集 def load_data(dir_name): files = os.listdir(dir_name) data = [] for file in files: if file.endswith('.wav'): file_path = os.path.join(dir_name, file) features = extract_features(file_path) data.append(features) return data # 加载数据集 rock_data = load_data('path/to/rock/music') jazz_data = load_data('path/to/jazz/music') # 将数据集转换为numpy数组 rock_data = np.array(rock_data) jazz_data = np.array(jazz_data) # 为每个数据集添加标签 rock_labels = np.zeros(len(rock_data)) jazz_labels = np.ones(len(jazz_data)) # 将数据集合并 data = np.vstack((rock_data, jazz_data)) labels = np.hstack((rock_labels, jazz_labels)) # 拆分数据集为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data, labels, test_size=0.2) # 训练GMM分类器 gmm = GaussianMixture(n_components=2, covariance_type='full') gmm.fit(X_train) # 预测测试集 y_pred = gmm.predict(X_test) # 计算准确率 accuracy = np.mean(y_pred == y_test) print('Accuracy:', accuracy) ``` 这个代码示例假设你有两个文件夹,一个文件夹包含摇滚音乐文件,另一个文件夹包含爵士音乐文件。你需要将代码中的路径更改为你的文件夹路径,并根据需要更改GMM的参数。这个代码示例使用了sklearn库中的GaussianMixture类来训练GMM分类器,并使用numpy库计算准确率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值