Python对QQ音乐进行爬取并进行数据分析

Python对QQ音乐进行爬取并进行数据分析

 

三方包引入

使用到了以下包:

  • 爬虫 scrapy
  • 网络测试 requests
  • 数据分析 numpy和pandas
  • 绘图 matplotlib和wordcloud
pip install scrapypip install requestspip install numpypip install pandaspip install matplotlibpip install wordcloud

爬取数据

打开QQ音乐网页版的分类歌单界面,乍一看,一分析网页源码,看到下图:

Python对QQ音乐进行爬取并进行数据分析

 

那么看来它就是使用动态填充的,那么它肯定就调用了接口,请求数据,那么就去找,在检查里的network中找啊找,最终找到了它:

Python对QQ音乐进行爬取并进行数据分析

 

Python对QQ音乐进行爬取并进行数据分析

 

然后写上代码,经过调试,终于成功了。

最后我把它保存成一个csv文件,通过播放量排序,截取前20,得到了下图

Python对QQ音乐进行爬取并进行数据分析

 

分析数据

对于这个数据的处理,就用到了numpy和pandas以及matplotlib。经过分析得出下图结果:

播放次数分析

Python对QQ音乐进行爬取并进行数据分析

 

标签分析

Python对QQ音乐进行爬取并进行数据分析

 

github地址:

https://github.com/arvinljw/SpiderNet/blob/master/qqmusic/qqmusic/spiders/qqmusic.py

转载于:https://www.cnblogs.com/dawning666/articles/9433946.html

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值