Python-Scrapy框架简介

是阿尘呀

于 2023-07-25 13:29:04 发布

阅读量86

点赞数

分类专栏： Python 文章标签： python scrapy 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72418211/article/details/132867917

版权

Python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

点击名片关注阿尘blog，一起学习，一起成长

本文主要简单介绍一爬虫框scrapy

01

—

简介

1.1 什么是scrapy

1）Scrapy是一个Python编写的开源网络爬虫框架。它是一个被设计用于爬取网络数据、提取结构性数据的框架。

2）scrapy用途广泛，可以用于数据挖掘、监测和自动化测试、信息处理和历史档案等大量应用范围内抽取结构化数据的应用程序框架，广泛用于企业

3）scrapy使用twisted这个异步网络库来处理网络通讯，架构清晰，并且包含了各种中间件接口，可以灵活的完成各种需求。scrapy是由twisted写的一个受欢迎的python事件驱动网络框架，他使用的是非堵塞的异步处理

1.2 使用scrapy有什么好处

1）更容易构建和大规模的抓取项目

2）内置的机制被称为选择器，用于从网站(网页)上提取数据

3）异步处理请求，速度非常快

4）可以使用自动调节机制自动调整爬行速度

5）确保开发人员可访问性

1.3 scrapy主要特点

1）是一个开源、免费使用的网络爬虫框架

2）scrapy生成格式导出如: JSON、CSV、XML

3）内置之处从源代码，使用xpath或者css选择器来提取数据

4）scrapy基于爬虫，允许以自动方式从网页中提取数据

1.4 scrapy优点

1）很容易扩展，速度快，功能强大

2）这是一个跨平台应用程序框架

3）scrapy请求调度和异步处理

4）scrapy附带了一个名为scrapyd的内置服务，允许使用JSON web服务上的项目和控制蜘蛛

5）能够刮削任何网站，即使该网站不具有元素数据访问api

02

—

scrapy基本原理

普通requests爬虫流程

Scrapy爬虫原理

简单描述：

最简单的单个网页爬取流程是： spiders ->scheduler -> downloader -> spiders -> item pipeline

注意！只用当调度器中不存在如何request了，整个程序才会停止，也就是说，对于下载失败的url，scrapy也会重新下载。

扫描二维码关注阿尘blog，一起交流学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python-Scrapy框架简介

点击名片关注阿尘blog，一起学习，一起成长本文主要简单介绍一爬虫框scrapy01—简介1.1 什么是scrapy1）Scrapy是一个Python编写的开源网络爬虫框架。它是一个被设计用于爬取网络数据、提取结构性数据的框架。2）scrapy用途广泛，可以用于数据挖掘、监测和自动化测试、信息处理和历史档案等大量应用范围内抽取结构化数据的应用程序框架，广泛用于企业3）scrapy使用twiste...
复制链接

扫一扫

专栏目录

是阿尘呀 CSDN认证博客专家 CSDN认证企业博客

码龄2年

41: 原创

39万+: 周排名

6万+: 总排名

3万+: 访问

: 等级

680: 积分

184: 粉丝

238: 获赞

11: 评论

357: 收藏

私信

关注

热门文章

分类专栏

golang 5篇
JavaScript 2篇
Python 18篇
C#

最新评论

Python-playwright：一款强大的UI自动化工具、新兴爬虫利器
南成旧巷: 牛批，非常好的文章，不水
JavaScript基础
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
JavaScript基础
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
JavaScript基础
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Python 高级特性汇总
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

是阿尘呀 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。