scrapy框架—spiders—获取下一页url

本文介绍了在Scrapy框架中如何使用`scrapy.Request()`构造请求来获取下一页URL。通过`yield scrapy.Request()`,可以将next_url发送给引擎并传递给调度器。如果下一页处理方式相同,直接使用即可;若不同,则需定义新的回调函数。同时,文中提到如果涉及cookies,不建议直接在headers中处理。回调函数的工作原理被比喻为商店购物的例子,形象地解释了其触发和响应过程。
摘要由CSDN通过智能技术生成

scrapy.Request(…) 构造请求

在这里插入图片描述
yield 可以yield四种类型的数据 : None值;dict ;request对象 …
yield scrapy.Request(…) 构造了一个请求 这个请求把 next_url 地址发给引擎 引擎再给调度器…

  • 如果下一页的处理方式和当前页一样 就可以直接 callback=self.parse
  • 如果下一页的处理方式和当前页不一样 就需要重新定义一个方法 比如 def parse1()

在这里插入图片描述
在这里插入图片描述

  • 这里如果用到 cookies 的话 cookie不能像普通爬虫一样直接放在headers里

callback 回调函数

你到一个商店买东西,刚好你要的东西没有货,于是你在店员那里留下了你的电话,过了几天店里有货了,店员就打了你的电话,然后你接到电话后就到店里去取了货。在这个例子里,你的电话号码就叫回调函数,你把电话留给店员就叫登记回调函数,店里后来有货了叫做触发了回调关联的事件,店员给你打电话叫做调用回调函数,你到店里去取货叫做响应回调事件。完毕。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值