python爬虫案例——抓取三级跳转网页,实现逐页抓取,数据存入mysql数据库(10)

1、目标任务

目标站点:情话网(http://www.ainicr.cn/tab/)
任务:抓取该网站下所有标签下的所有情话语句,并将其存入mysql数据库

2、网页分析

  1. 用浏览器打开网页,按F12或右键检查,进入开发者模式,在Network-Doc下找到网页的数据接口,发现该网页的内容存在于该接口下,该网页就是一级网页,我们将抓取该网页所有标签的链接
    在这里插入图片描述
  2. 第1步抓取到所有的标签链接后,我们将依次向这些链接发送请求,解析二级页面你的内容;我们先随便进入一个标签链接,发现二级页面的内容存放在Network-Doc下,接下来我们将抓取所有三级页面的链接
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

盲敲代码的阿豪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值