1.环境配置
pydub是一个很好用的音频处理库,简单易用。
python_speech_featrues 音频特征提取库,包含傅里叶变换和梅尔倒谱(MFCC)
FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。它包括了领先的音/视频编码库libavcodec等。
使用pydub进行格式转化,使用python_speech_featrues完成特征提取。
2.数据清洗
对数据进行清洗,去除坏数据,对空值进行填充或去
2.特征工程
可以使用歌曲本身提取的特征,也可根据歌词的文本信息提取相应的特征
此处可能会用到Word2vec等方法,同时,还用到傅里叶变换,梅尔倒谱等。
3.建模调参
选择合适的模型进行训练,并对模型进行调参。
4.预测