scrapy框架—spiders—获取下一页url

最新推荐文章于 2023-06-09 18:56:06 发布

在下平兄

最新推荐文章于 2023-06-09 18:56:06 发布

阅读量940

点赞数

分类专栏： Scrapy框架

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44494778/article/details/95325409

版权

本文介绍了在Scrapy框架中如何使用`scrapy.Request()`构造请求来获取下一页URL。通过`yield scrapy.Request()`，可以将next_url发送给引擎并传递给调度器。如果下一页处理方式相同，直接使用即可；若不同，则需定义新的回调函数。同时，文中提到如果涉及cookies，不建议直接在headers中处理。回调函数的工作原理被比喻为商店购物的例子，形象地解释了其触发和响应过程。

摘要由CSDN通过智能技术生成

scrapy.Request(…) 构造请求

在这里插入图片描述
yield 可以yield四种类型的数据： None值；dict ；request对象 …
yield scrapy.Request(…) 构造了一个请求这个请求把 next_url 地址发给引擎引擎再给调度器…

如果下一页的处理方式和当前页一样就可以直接 callback=self.parse
如果下一页的处理方式和当前页不一样就需要重新定义一个方法比如 def parse1()

在这里插入图片描述

这里如果用到 cookies 的话 cookie不能像普通爬虫一样直接放在headers里

callback 回调函数

你到一个商店买东西，刚好你要的东西没有货，于是你在店员那里留下了你的电话，过了几天店里有货了，店员就打了你的电话，然后你接到电话后就到店里去取了货。在这个例子里，你的电话号码就叫回调函数，你把电话留给店员就叫登记回调函数，店里后来有货了叫做触发了回调关联的事件，店员给你打电话叫做调用回调函数，你到店里去取货叫做响应回调事件。完毕。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

在下平兄 CSDN认证博客专家 CSDN认证企业博客

码龄6年

85: 原创

30万+: 周排名

143万+: 总排名

3万+: 访问

: 等级

1047: 积分

137: 粉丝

27: 获赞

5: 评论

73: 收藏

私信

关注

热门文章

分类专栏

PHP 21篇
mysql 5篇
python 13篇
web服务器框架
爬虫 11篇
多线程 2篇
多进程
协程
Scrapy框架 11篇
HTML 1篇
css 9篇
JS 8篇

最新评论

scrapy框架—spiders—获取下一页url
先生の一言: 倒数第五行最后的next_url要转换str(next_url)
selenium测试工具实现爬虫
甜甜圈字: 大佬，可以转载吗？
PHP内建函数
物业资产管理: 还有好多吧？常用的是哪些呢？
scrapy框架爬虫详细分析历程-腾讯招聘
hi_1900: 大神，请收下我的双膝，解析的很详细，跟我今天下午遇到的问题一摸一样，我只看了elements忘了查看源代码，代码写完不会出结果,然后才回过头来检查网页源代码，这才发现问题，谢谢大神的详解，能不能导出分享个md文件，想保存一下大神的详解~

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。