「python」快速入门Scrapy框架的5个执行模组及架构——第一篇

Scrapy是一个高效的Python网页爬虫框架,基于Twisted,适合大型项目。它包括5个主要模组:SPIDERS、ENGINE、SCHEDULER、DOWNLOADER和ITEM PIPELINE。本文介绍了这些模组的职责和Scrapy的执行流程,帮助初学者快速入门。
摘要由CSDN通过智能技术生成

在这里插入图片描述
一般想要自动化搜集网页上的资料时,普遍都会使用像BeautifulSoup或Selenium套件开发Python网页爬虫来取得,但是,如果所要爬取的资料量较大,拥有复杂的逻辑处理及效率的要求,这时候就会建议使用Scrapy框架,来帮助开发人员建立一个维护性较好的Python网页爬虫。

而要使用Scrapy框架来开发大型的Python网页爬虫专案前,本文就先来带大家了解一下Scrapy框架的以下三个基本观念:

Scrapy框架是什么

Scrapy框架模组

Scrapy框架执行执行流程

一、Scrapy框架是什么

Srapy是一个网页爬虫「框架」,拥有完整的Python网页爬虫开发功能,也提供开发人员能够进行客制化,并且,有一定的专案架构及执行流程,所以在未来的维护上较为容易。

另外,Scrapy框架是基于Twisted非同步网络框架所建立的,执行效率也非常的好,适用于大型的Python网页爬虫专案。而Scrapy框架与常应用于网页爬虫的BeautifulSoup及Selenium套件比较,可以参考「python」BeautifulSoup,Selenium,Scrapy三大爬虫工具比较文章

二、Scrapy框架模组

Scrapy框架是由以下5个主要模

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mikes zhang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值