原作者 Juan De Dios Santos
编译 CDA 编译团队
本文为 CDA 数据分析师原创作品,转载需授权
Spotify 是全球最大的正版流媒体音乐服务平台,深受全球用户的喜爱。那么你的歌单无聊吗?一位程序员小哥对自己的Spotify歌单进行了数据分析。
几天前,我正在和一个朋友聊天,同时听着我的 Spotify 歌单里的歌。听了几首歌,她说:“你的音乐品味很有意思...你的歌单音乐 很 多样 , 器乐音乐多 ,还有些 无聊 ”。
听到这个评论,我笑了,因为这不是第一次别人这么说我了。我承认我的音乐品味有点奇怪。比如,我会听一些 Kendrick Lamar (美国说唱歌手)的歌,然后会切换到《盗梦空间》配乐,接着又是西班牙萨尔萨舞曲。
不过,她的评论给了我一个灵感:让我们看看数据是怎么说的。
所以,我进行了一个实验。
在实验中,我分析了我的 Spotify 歌曲,看看它们是否真的 很多样化,器乐音乐多而且无聊 。此外,为了加强趣味性,我把这三个特征与我朋友的歌单进行了比较 。最后,我构建了一个机器学习模型,目的是预测某首歌更适合我的歌单还是她的。
工具
当中使用的主要工具是 Spotify API 服务的音频特性组件。这些音频特征代表了一首歌曲的特点。稍后我将更详细地解释这些特性。
我们用 Python 来获取数据,并利用 scikit- learn 来训练机器学习模型。同时使用 R 语言进行数据分析。
数据
歌曲的数据是用我写的一个 Python 脚本获取的,该脚本获取一个用户的所有播放列表,以及特定播放列表的所有歌曲。一旦我有了歌曲的基本信息,包括 Spotify ID,我就能使用该脚本获取音乐的音频特征。
由此产生的数据集由 15 列和 1074 首歌曲组成,其中 563 首来自我的歌单,511 首来自她的歌单(从现在起,我将把我的朋友称为她)。
在数据集的 15 列中,只有与音频特性相关的部分被使用。在下面的列表中,我将介绍并解释它们的含义(在某些情况下,我只会复制来自 Spotify 的描述)。 注意:所有特性的值在 0.0 - 1.0 范围内。
• 器乐性 &