前言
在爬取csdn博客排行榜之前,我们看到页面的加载形式,相信懂的人一眼就知道是Ajax 动态请求,关于Ajax这里不再细说,可以看小编上一篇关于爬虫Ajax的文章——Python爬虫| Ajax动态解密
这里只针对python类目的数据进行爬取(https://blog.csdn.net/rank/list?type=python)

爬虫之前的准备工作
下面,直接跟着小编进入主题。用谷歌浏览器打开网页,按F12键打开开发者工具,对页面进行刷新,会出现一堆链接,这个时候就要考验观察力和平时对爬虫项目的经验了。相信有的朋友,可能一眼就看出来了,找到这个信息并点开会找到重要的信息,如下:

本文介绍了如何使用Python爬虫抓取CSDN博客的Python类目排行榜数据。通过分析Ajax动态请求,发现关键参数page、pageSize和child_channel,并展示了实现代码,成功获取到目标数据。
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



