scrapy框架的工作流程

最新推荐文章于 2023-08-02 18:54:04 发布

羽落长安丶

最新推荐文章于 2023-08-02 18:54:04 发布

阅读量1.2k

点赞数 2

分类专栏： Python

Python 专栏收录该内容

26 篇文章 2 订阅

订阅专栏

scrapy框架的工作流程：

首先spiders（爬虫）将需要发送请求的url（request）经scrapyEngine（引擎）交给scheduler（调度器）。
scheduler（排序，入队）处理后，经scrapyEnging，DowmloaderMiddlewares（可选，主要有User-Agent，Proxy代理）交给Downloaders。
Downloaders向互联网发送请求，并接收下载响应（response），将响应经scrapyEngine，spiderMiddlewares（可选）交给spiders。
spiders处理response，提取数据并将数据经scrapyEngine交给Itempipline保存（可以是本地可以是数据库）。
提取的url重新经scrapyEngine交给scheduler进行下一个循环，知道无url请求时程序停止结束。

羽落长安丶

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy框架的工作流程

scrapy框架的工作流程：首先spiders（爬虫）将需要发送请求的url（request）经scrapyEngine（引擎）交给scheduler（调度器）。scheduler（排序，入队）处理后，经scrapyEnging，DowmloaderMiddlewares（可选，主要有User-Agent，Proxy代理）交给Downloaders。Downloaders向互联网发送请求，...
复制链接

扫一扫

专栏目录

羽落长安丶 CSDN认证博客专家 CSDN认证企业博客

码龄6年

21: 原创

33万+: 周排名

115万+: 总排名

6万+: 访问

: 等级

671: 积分

11: 粉丝

28: 获赞

9: 评论

108: 收藏

私信

关注

热门文章

分类专栏

图像识别 1篇
Python 26篇
jQuery 1篇
数据结构 3篇
编码规范 2篇

最新评论

Python：strip（）方法的正则表达式版本
代码真令我开心: 这个思路挺好的，谢谢分享。我试了一下，当字符串中有’+‘号等再re模块中有特殊定义的，运行结果就会报错。
python：遍历多维数组
逆风少女: 意满离
被爬虫盯上的50家网站
fkdlz-疯狂的落枕ὢ: 你这文章里面说有图，那图呢？转载之后是不是忘了贴上来了
python：遍历多维数组
酒萌子: 对啊，压根不是三维四维
python：遍历多维数组
暴走的二哈: 矩阵是np.array

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。