适用于Python入门者的爬虫和数据可视化案例

最新推荐文章于 2025-01-12 15:55:29 发布

Python 学习者

最新推荐文章于 2025-01-12 15:55:29 发布

阅读量1.3w

点赞数 19

分类专栏： python 文章标签： python 爬虫

原文链接：https://blog.csdn.net/qdPython?spm=1011.2124.3001.5343

版权

python 专栏收录该内容

1470 篇文章

订阅专栏

本篇文章适用于Python小白的教程篇，如果有哪里不足欢迎指出来，希望对你帮助。

本篇文章用到的模块：

requests,re,os,jieba,glob,json,lxml,pyecharts,heapq,collection

首先

我们先进入到需要抓取的内容的地址：http://music.163.com/#

本文我们的目的

抓取周杰伦的所有歌曲，
歌词，
以及评论

直接在搜索框搜索周杰伦

适用于Python入门者的爬虫和数据可视化案例

第一步：

抓取所有专辑进入http://music.163.com/#/artist/album?id=6452如下图所示！

适用于Python入门者的爬虫和数据可视化案例

在谷歌浏览器的抓包工具（F12)里面查看交互信息发现如下：

适用于Python入门者的爬虫和数据可视化案例

如图所示：是我们需要的信息，知道这些事情就变得简单了

我们不需要用复杂的工具比如（selenium）去加载整个页面

事实上，如果还没想到抓取歌曲的方法，我估计就得用它了

我们再看header里面有什么

适用于Python入门者的爬虫和数据可视化案例

更多Python相关视频、资料加群857662006免费获取

这里面的string就不用管了，因为它已经在我们的url里面了

只需要看request headers 这个就是我们给服务器发送的东西，

发送之后，服务器返回给我们的就是network里面的信息。

好，接下来我们伪造浏览器发送请求。

具体代码如下：

适用于Python入门者的爬虫和数据可视化案例

这里面用到了xpath来找到对应标签里面数据，

代码不重要，思想懂了就行（代码单独执行可行）

执行结果如下：

适用于Python入门者的爬虫和数据可视化案例

开始抓取歌曲信息

适用于Python入门者的爬虫和数据可视化案例

同样的道理我们通过伪造方式发送信息，获取歌曲信息！！

直接上代码

适用于Python入门者的爬虫和数据可视化案例

上面需要注意：xpath来获取需要的信息，利用正则来获取ID（其实有很多方法）

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

一样的道理，我们分析network来获取我们需要的信息歌词，评论！！

直接上代码

适用于Python入门者的爬虫和数据可视化案例

上面需要注意的是：利用json获取需要的数据(至少比正则快点)

适用于Python入门者的爬虫和数据可视化案例

数据分析，可视化

适用于Python入门者的爬虫和数据可视化案例

上面需要注意的是：我们合并数据的时候，可以选择性的删除一些无用数据

适用于Python入门者的爬虫和数据可视化案例

下面我们对周杰伦歌曲进行情绪化分析

适用于Python入门者的爬虫和数据可视化案例

下面完成数据词频各种分析

适用于Python入门者的爬虫和数据可视化案例

我们来看下结果

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

适用于Python入门者的爬虫和数据可视化案例

怎么样，学到了吗？看完记得动手操作哦！

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。