【Python爬虫】新浪微博热搜爬虫

本文详述了如何使用Python和requests_html库抓取新浪微博热搜榜的步骤,包括解析网页结构,找到每个热搜项的selector,并编写代码实现爬取1到51条热搜的过程。
摘要由CSDN通过智能技术生成

新浪微博热搜爬虫

本文详细介绍了爬取新浪微博热搜榜单的步骤,只需使用python软件本体和requests_html库即可完成,难度小,完成快,适合新手上手练习。

第一步:进入新浪热搜完整榜单页面,记录页面网址。

在这里插入图片描述

第二步:按F12,打开开发者工具。(使用Chorme浏览器)

在这里插入图片描述

第三步:点击开发者工具左上角图标,然后点选热搜榜中的文字,就可以找出热搜榜中的每一个在网页中的具体位置。

在这里插入图片描述

第四步:在开发者工具中的蓝色部分右击鼠标,依次选择Copy–Copy selector,就可以获得到这个热搜位置的selector。

在这里插入图片描述

第五步:依次复制前几个热搜的selector,就可以发现规律——只需改变child()中的数字,从1到51,即可获得完整榜单的selector

在这里插入图片描述

做到这里,就已经找到了热搜榜网页网址,还有每一条热搜的selector,下面进入写代码阶段。
第一步:准备工作(需提前安装第三方库requests_html)
from requests_html import HTMLSession

session = HTMLSession(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值