python爬虫基础(13:Scrapy框架之架构流程与目录)

本文介绍了Scrapy爬虫框架的基本架构和工作原理,包括Scrapy Engine、Scheduler、Downloader、Spiders、Item Pipeline以及中间件的作用。Scrapy Engine负责组件间的通讯和数据传递;Scheduler进行请求调度;Downloader负责下载;Spiders处理响应并提取数据;Item Pipeline处理和存储数据。文章还详细阐述了Scrapy的执行流程,并解析了项目目录结构,帮助读者理解Scrapy的使用和组织方式。
摘要由CSDN通过智能技术生成

框架

对于特别小的爬虫,一般直接编写就可以了,但一般面对一个项目级别的爬虫,都选择用框架

框架可以理解为一个 等你填坑的代码:

       1. 为你编写好那些必须的、重复的代码

       2. 为你模块化好每一个组件,自动建立组件之间的联系,这样就方便使用者清晰了解它的流程和各功能的定制

Scrapy框架架构和原理

Scrapy就是一个爬虫常用的框架,我们先来了解一下它的结构和原理:

组件图

âscrapyæµç¨å¾è¶æ¸âçå¾çæç´¢ç»æ

组件介绍

Scrapy Engine: 这是引擎,负责Spiders、ItemPipeline、Downloader、Scheduler中间的通讯,信号、数据传递等等!(像不像人的身体&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值