1 项目描述
有一家音乐app公司希望我们提供一个音乐分类器,他们希望得到的结果是:输入一首歌,可以对输入的歌曲进行分类。
2 项目难点
2.1 维度的问题
音乐是几维? 如何给音乐升维呢?
如果音乐是一单声道的,它就是一维,如果音乐是双声道的,他就是二维
2.2 音乐数据
- 首先把一个wma文件读入python,然后绘制它的频谱图(spectrogram)来看看是什么样的?如下图所示:
- 其次我们把每一种的音乐都抽一些出来打印频谱图以便比较:
2.3 时域和频域
-
时域是横向的;
-
频域是纵向的;
2.4 傅立叶变化FFT
FFT是一种数据处理技巧,它可以把time domain上的数据,例如一个音频,拆成一堆基准频率,然后投射到frequency domain上。