Scrapy框架的基本流程

最新推荐文章于 2023-02-25 22:30:52 发布

Pythonista Wong

最新推荐文章于 2023-02-25 22:30:52 发布

阅读量273

点赞数

分类专栏： Scrapy 文章标签： python

本文链接：https://blog.csdn.net/PythonWangbo/article/details/105293539

版权

1 篇文章 0 订阅

订阅专栏

Scrapy框架的操作流程（14部分）

Scrapy引擎从Spider获取起始的Request
Scrapy引擎将获取到的Request发给调度中心排列入队
Scrapy引擎从调度中心请求获取需要处理的Request
Scrapy引擎获取到需处理的Request后，将Request发给下载器
Request在传递给下载器的过程中会经过下载器中间件，对Request进行处理
下载器根据Request从Internet从下载内容，封装成Request对象传递给Scrapy引擎
下载器将Response传递给Scrapy引擎时，也会经过下载器中间件，对Request进行处理
Scrapy引擎将接收到的Response传递给Spider进行处理
Response传递给Spider的过程中，会经过Spider中间件，对Response进行处理。
10.Spider接收Response，处理完之后会生成一个包含需要继续爬取网址的Response和一个Item对象组成的result，将其中的item发送给ITem pipeline进行处理，将其中的Requset发给调度器排列入队列

关注

专栏目录