由于毕业论文打算做音乐推荐相关的研究,所以有一段时间都花在了音乐数据集的调研上。几经探索,终于找到一个满足自己需求的公开数据集:Million Song Dataset(MSD)。
MSD简介
与其说MSD是一个数据集,还不如说它是一个资源整合平台。它搜集了来自SecondHandSongs dataset 、Last.fm dataset 等7个知名并且权威的音乐社区的数据。当中除了各大音乐网站的原始数据外,MSD还对它们进行了必要的分析和提取;同时也通过MSD自有的track_id来对各大平台的数据进行匹配。MSD包含的数据量和信息量都很多,只要愿意去挖掘,应当能够从中获益。