python可视化分析网易云音乐评论_网易云音乐评论催泪刷屏?我用Python抓取了1008328条热评告诉你为什么!...

?url=http%3A%2F%2Fspider.ws.126.net%2F39ac3576421f036943a3797b538be509.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

文/程天 版面/胡曼君

镝摘

如果再过20年,你还会记得那些年上过的网易云热评吗?

看了那么多的网易云热评,技术思维作祟,我终于也忍不住写个爬虫,用Python通过对1008328条网易云音乐热评的抓取,我们可以得出一个对百万热评的基本风格画像。

以下三个链接是网易云音乐歌单列表、歌单和歌曲的示例链接。

http://music.163.com/#/discover/playlist

http://music.163.com/#/playlist?id=124974725

http://music.163.com/#/song?id=28875230

抓取热门歌单

01

\$ python playlist.py 粤语 1 10

\$ # 抓取粤语歌单列表热门前十页

\$ python playlist.py 1 10

\$ # 抓取热门歌单前十页的歌单名字和链接

抓取歌单内歌曲

02

\$ python music.py database

\$ # 抓取存储的热门歌单里面的歌曲,批量抓取

\$ python music.py playlist 376259016

\$ # 抓取编号为 376259016 的歌单

抓取歌曲评论

03

\$ python comment.py

\$ # 自动抓取已存储歌曲,并保持去重复

TODO

04

增加抓取歌单页面个性推荐歌单

增加抓取排行榜

严格去重复

优化代码结构,冗余代码过多

BUG

05

若干歌单无法抓取,待重现定位

...

(具体技术细节请阅读原文了解Github上面源码)

...

接下来我们就可以看到bling bling的分析结果了!

1.评论TOP20歌曲:

?url=http%3A%2F%2Fspider.ws.126.net%2Fb1c4c758547e162f3e07551fa0d42958.png&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F9371f645507dc71729ecea818ceabfd0.png&thumbnail=650x2147483647&quality=80&type=jpg

可以看到,近年在网易云音乐大红的薛之谦在名单上独占六席,这非常不容易。当然,近十年华语乐坛最成功的流行音乐创作歌手周杰伦,在这份名单上以一首《晴天》排名第一,并且领先第二名接近一倍的评论数。

那么我们换一个维度,看看哪些歌手被评论最多:

?url=http%3A%2F%2Fspider.ws.126.net%2F2f35db90c8e731296528c8e41cac96a4.png&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F3934f8bf4c8c5daf5050610cec696028.png&thumbnail=650x2147483647&quality=80&type=jpg

图中包括陈粒、李荣浩、李志、赵雷、陈奕迅、王菲宋冬野等人物悉数入选,他们也是近些年华语乐坛粉丝比较狂热或者作品比较丰富的歌手。

然后,让我们看看,那些热评,都写的什么?

2.Top10热门的带故事的评论

?url=http%3A%2F%2Fspider.ws.126.net%2Fbacca516e99b38e5c7ecb57040754a34.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F139c2590c28bf3092810235ebe3f7f89.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2Fb0c7626f74b64266aebaedb775a22b40.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F526c6a12f6ba201de71568c7d3b7bd73.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F8395ce2afb6043574f3998b71cb8d86e.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F2e8ede2f3065e8842c26c2f35a0ccd7b.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2Fad739e4419105e8a2b25a1d7a41f4a55.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F298eaa01ad998620ee252cf6a86c14b0.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

相对于上面这些带故事的评论,似乎网易云音乐全站Top20的热评也不全都是那些常规意义的“好评论”,譬如:

?url=http%3A%2F%2Fspider.ws.126.net%2Fe2757b2bf43e36784fd712e6f42a6b8a.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F866004339b501d42db2cb78c8e4028bc.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F0d4a37d44e56e076f5ebf3d91f12067f.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F0522eefb7113a7ab9f719981fcd14a53.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F83df7a0115e648f94ba4d5eb7fac2cdb.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F792bd487103f5814779892cf8f1e1116.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F1908e9281d7eeebbf44e429870ae8522.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F277672258fbe5ff14cf2dc3b4dd1d842.png&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2Fd5279ec8b20ac907a47d6053aa9241e8.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F1ee4a3c55a91531b388475799f482815.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2Fd0ade518d6c14a0f856fa81a6202daa0.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2Ff41ba95f28f8027e1485ebd1afe6dcd1.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2Fbf155a7014aa7fd286dbd2eab95dff69.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F835a1bfd7c056e5676e2ed5821e43d7c.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

?url=http%3A%2F%2Fspider.ws.126.net%2F87f8f107199b7f3970e90e529a937db2.jpeg&thumbnail=650x2147483647&quality=80&type=jpg

你眼里的段子,其实是别人的故事。

点击下方阅读原文。

fe677537e69c75f276c9adf22742665c.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值