Python分析盘点2024全球流行音乐：是哪些歌曲榜单占领了我们？(1)

2401_84139587

于 2024-05-17 03:24:15 发布

阅读量668

点赞数 24

分类专栏：程序员文章标签： python 学习面试

本文链接：https://blog.csdn.net/2401_84139587/article/details/138984578

版权

程序员专栏收录该内容

148 篇文章 1 订阅

订阅专栏

（1）Python所有方向的学习路线（新版）

这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

最近我才对这些路线做了一下新的更新，知识体系更全面了。

在这里插入图片描述

（2）Python学习视频

包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然没有那么全面，但是对于入门来说是没问题的，学完这些之后，你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。

在这里插入图片描述

（3）100多个练手项目

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了，只是里面的项目比较多，水平也是参差不齐，大家可以挑自己能做的项目去练练。

在这里插入图片描述

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘节奏’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df.head(10)

看英语的总是不习惯，所以我们可以把英语的列名改为中文。

二、数据分析

1、2019全球最流行的音乐类型排行

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘音调’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df=df.groupby(‘类型’)[‘曲名’].count().reset_index()

df=df.sort_values(by=‘曲名’,ascending=False).reset_index()

cloud=WordCloud(title=‘2019最流行的音乐类型’,width=800,height=420)

cloud.add(name=‘音乐类型’,attr=df[‘类型’],value=df[‘曲名’],word_size_range=(12,60))

cloud.render(‘2019全球最流行的音乐类型.html’)

cloud

从词云图可以看到，2019年全球最火的还是流行音乐（pop&dance pop）。鉴于其他类型的音乐我都不认识，所以下面的分析，我会直接对pop&dance pop作为主要对象，把他们归为一类。

2、2019年全球流行音乐排行

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘音调’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df=df.replace(‘dance pop’,‘pop’)

df=df[df[‘类型’]==‘pop’].reset_index().drop(‘index’,axis=1)

通过上述代码，我已经把dance pop的类型全部换成pop。

#接上面的代码

df=df.replace(‘dance pop’,‘pop’)

df=df[df[‘类型’]==‘pop’].reset_index().drop(‘index’,axis=1)

df.pivot_table(df,index=‘曲名’).sort_values(by=‘火热程度’,ascending=False).reset_index()

How Do You Sleep?

这是全球最流行的15首流行歌曲。

结合前面的图我们可以知道：这些流行歌曲的口语化程度低，歌词普遍比较优美，有意境；同时时长恰当，多在3分钟左右…

3、根据流行程度对歌曲进行分类颁奖

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘音调’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df=df.replace(‘dance pop’,‘pop’)

df=df[df[‘类型’]==‘pop’].reset_index().drop(‘index’,axis=1)

df=df.pivot_table(‘火热程度’,index=‘曲名’).sort_values(by=‘火热程度’,ascending=False).reset_index()

def grade(火热程度):

if(火热程度>=90):

return ‘年度最热’

if(火热程度>=85):

return ‘年度火热’

else:

return ‘年度流行’

df[‘授予荣誉’] = df.apply(lambda x :grade(x[‘火热程度’]), axis=1)

我们知道，很多媒体都喜欢搞排行榜，而且喜欢给歌曲颁奖，这些颁奖一般会根据几个标准进行打分，算出综合排名。不过这个比较复杂，这里只根据流行程度颁奖，大于90分的就是年度最热；85-89的是年度火热；84以下的就是年度流行。这个实现代码很简单，做出分类，再给数据加一列，命名为“授予荣誉”即可。

#接上面的代码

plt.rcParams[‘font.sans-serif’]=[‘SimHei’]

plt.figure(figsize=(8,4))

sns.countplot(x=“授予荣誉”,data=df, order=[‘年度最热’,‘年度火热’,‘年度流行’],palette=“muted”)

plt.title(‘2019年全球流行音乐荣誉’,loc=‘left’,size=15)

plt.xlabel(‘授予荣誉’,size=15)

plt.ylabel(‘数量’,size=15)

plt.grid(False)

sns.despine(left=False )

这是对荣誉情况的统计，适用于数量比较大的情况。

4、2019全球最火流行歌手排行榜

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘音调’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df=df.replace(‘dance pop’,‘pop’)

df=df[df[‘类型’]==‘pop’].reset_index().drop(‘index’,axis=1)

df=df.pivot_table(‘火热程度’,index=‘歌手’,aggfunc=‘count’).sort_values(by=‘火热程度’,ascending=False).reset_index()

df=df.rename(columns={‘火热程度’:‘上榜次数’})

这是全球最火的十大流行音乐歌手的排行。当然下面的图更直观：

#Python学习群 592539176

#接上面的代码

plt.rcParams[‘font.sans-serif’]=[‘SimHei’]

x=df[‘歌手’]

y=df[‘上榜次数’]

plt.figure(figsize=(12,4))

plt.bar(x,y,width=0.5,align=‘center’)

plt.title(‘2019全球最火流行歌手排行榜’,loc=‘left’,size=15)

for a,b in zip(x,y):

plt.text(a,b,b,ha=‘center’,va=‘bottom’,fontsize=12)#显示额度标签

plt.xlabel(‘歌手’,size=15)

plt.ylabel(‘上榜次数’,size=15)

plt.xticks(x,size=12,rotation=30)

plt.yticks(size=15,)

plt.grid(False)

最后

🍅 硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。
🍅 面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。
🍅 知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取