scrapy启动流程图（3）——engine.py的内部运作图(1)

最新推荐文章于 2023-11-10 09:48:40 发布

三头六臂的小白

最新推荐文章于 2023-11-10 09:48:40 发布

阅读量597

点赞数 1

分类专栏：爬虫 python开发文章标签：爬虫 python 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bf96163/article/details/113607841

版权

python开发同时被 2 个专栏收录

39 篇文章 2 订阅

订阅专栏

9 篇文章 2 订阅

订阅专栏

这就是回调地狱！！！同志们不要学！！！所有的异常和数据处理下载等都被绑在request相关的deferred对象里了

本文解释了运行

scrapy crawl xxspider

命令后，scrapy内部是如何跑的，一步步拆解看

从命令行解析到具体调用命令请看:第一篇《scrapy启动流程图（超详细）——cmdline.py解析》

从具体命令到创建crawlerprocess和实例化crawler 请看:第二篇《 scrapy启动流程图（2）——crawler的启动流程图》

下面的流程图详细的解释了engine代码之间是如何调用的

这里提前说明几点：

1.为什么request只有压入没有弹出？

因为弹出是scraper内部的item处理类来调用的，engine里有download方法做为接口

2.程序准确的运行时间是什么时候？

是在上一层 Crawlerprocess里面的函数start 调用了

reactor.run 以后这些代码才算是开始跑对于deferred的各种操作仅仅可以当做是一种配置

deferred对象相当于结果的替代品，因为个结果还没生成

3.开启和关闭的部分代码为何没有解释？

开启和关闭的主要过程就是实例化相关的类 log 以及发送信号，关闭也就是这个过程倒放一遍代码不难

4.engine.start的意义在哪里？

主要是生成一个deferred对象，当这个engine跑完了以后可以调用一些针对engine结束后的回调

具体请看流程图:

实际流程图

三头六臂的小白

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
scrapy启动流程图（3）——engine.py的内部运作图(1)

这就是回调地狱！！！同志们不要学！！！所有的异常和数据处理下载等都被绑在request相关的deferred对象里了本文解释了运行scrapy crawl xxspider命令后，scrapy内部是如何跑的，一步步拆解看从命令行解析到具体调用命令请看:第一篇《scrapy启动流程图（超详细）——cmdline.py解析》从具体命令到创建crawlerprocess和实例化crawler 请看:第二篇《scrapy启动流程图（2）——crawler的启动流程图》下面的流程图详细.
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。