python爬虫数据可视化_适用于Python入门者的爬虫和数据可视化案例

本篇文章适用于Python小白的教程篇,如果有哪里不足欢迎指出来,希望对你帮助。

本篇文章用到的模块:

requests,re,os,jieba,glob,json,lxml,pyecharts,heapq,collection

首先

本文我们的目的

抓取周杰伦的所有歌曲,

歌词,

以及评论

直接在搜索框搜索周杰伦

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

第一步:

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

在谷歌浏览器的抓包工具(F12)里面查看交互信息发现如下:

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

如图所示:是我们需要的信息,知道这些事情就变得简单了

我们不需要用复杂的工具比如(selenium)去加载整个页面

事实上,如果还没想到抓取歌曲的方法,我估计就得用它了

我们再看header里面有什么

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

这里面的string就不用管了,因为它已经在我们的url里面了

只需要看request headers 这个就是我们给服务器发送的东西,

发送之后,服务器返回给我们的就是network里面的信息。

好,接下来我们伪造浏览器发送请求。

具体代码如下:

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

这里面用到了xpath来找到对应标签里面数据,

代码不重要,思想懂了就行(代码单独执行可行)

执行结果如下:

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

开始抓取歌曲信息

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

同样的道理我们通过伪造方式发送信息,获取歌曲信息!!

直接上代码

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

上面需要注意:xpath来获取需要的信息,利用正则来获取ID(其实有很多方法)

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

一样的道理,我们分析network来获取我们需要的信息歌词,评论!!

直接上代码

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

上面需要注意的是:利用json获取需要的数据(至少比正则快点)

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

数据分析,可视化

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

上面需要注意的是:我们合并数据的时候,可以选择性的删除一些无用数据

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

下面我们对周杰伦歌曲进行情绪化分析

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

下面完成数据词频各种分析

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

我们来看下结果

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

a3e244063003

适用于Python入门者的爬虫和数据可视化案例

怎么样,学到了吗?看完记得动手操作哦!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值