Scrapy 源码剖析（一）架构概览

最新推荐文章于 2024-05-11 13:08:28 发布

Magic-Kaito

最新推荐文章于 2024-05-11 13:08:28 发布

阅读量858

点赞数 4

分类专栏：爬虫实战文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ynxts/article/details/112342537

版权

微信搜索关注「水滴与银弹」公众号，第一时间获取优质技术干货。7年资深后端研发，用简单的方式把技术讲清楚。

在爬虫开发领域，使用最多的主流语言主要是 Java 和 Python 这两种，如果你经常使用 Python 开发爬虫，那么肯定听说过 Scrapy 这个开源框架，它正是由Python编写的。

Scrapy 在开源爬虫框架中名声非常大，几乎用 Python 写爬虫的人，都用过这个框架。而且业界很多开源的爬虫框架都是模仿和参考 Scrapy 的思想和架构实现的，如果想深入学习爬虫，研读 Scrapy 的源码还是很有必要的。

从这篇文章开始，我就和你分享一下当时我在做爬虫时，阅读 Scrapy 源码的思路和经验总结。

这篇文章我们先来介绍一下 Scrapy 的整体架构，从宏观层面上学习一下 Scrapy 运行的流程。之后的几篇文章，我会带你深入到每个模块，剖析这个框架的实现细节。

介绍

首先，我们先来看一下 Scrapy 的官方是如何介绍它的。从官方网站，我们可以看到 Scrapy 如下定义。

Scrapy 是一个基于 Python 语言编写的开源爬虫框架，它可以帮你快速、简单的方式构建爬虫，并从网站上提取你所需要的数据。

也就是说，使用 Scrapy 能帮你快速简单的编写一个爬虫，用来抓取网站数据。

本篇文章不再介绍 Scrapy 的安装和使用，这个系列主要通过阅读源码讲解 Scrapy 的实现思路，关于如何安装和使用的问题，请参考官方网站

最低0.47元/天解锁文章

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
2
评论
Scrapy 源码剖析（一）架构概览

微信搜索关注「水滴与银弹」公众号，第一时间获取优质技术干货。7年资深后端研发，用简单的方式把技术讲清楚。在爬虫开发领域，使用最多的主流语言主要是 Java 和 Python 这两种，如果你经常使用 Python 开发爬虫，那么肯定听说过 Scrapy 这个开源框架，它正是由Python编写的。Scrapy 在开源爬虫框架中名声非常大，几乎用 Python 写爬虫的人，都用过这个框架。而且业界很多开源的爬虫框架都是模仿和参考 Scrapy 的思想和架构实现的，如果想深入学习爬虫，研读 Scrapy 的.
复制链接

扫一扫

专栏目录

Magic-Kaito CSDN认证博客专家 CSDN认证企业博客

码龄13年

27: 原创

9万+: 周排名

210万+: 总排名

7万+: 访问

: 等级

726: 积分

173: 粉丝

203: 获赞

31: 评论

594: 收藏

私信

关注

热门文章

分类专栏

最新评论

什么是定点数？
高富诚: 在嵌入式开发过程中，由于内存资源是有限的，一味地使用浮点数会造成内存资源的浪费，因此嵌入式开发大多使用定点数，以实现数据精度贺运算速度的平衡
什么是浮点数？
做而论道_CS: 讨论浮点数，有意思吗？浮点数，与计算机的关系，也只能理解四个字节而已。它是用 32 位数，代表了更大范围的数字。这个事，只能说是“加密解密”的技术而已。加解密，都是数学知识，与计算机没有半点关系。浮点数的运算，是由 “浮点机” 实现的。（什么是定点机、浮点机，你可别说不知道啊。）浮点数的运算，并不需要你来编程。什么：对阶、舍入、上下溢、规格化 ...，浮点机，自动就帮你完成这些运算了。浮点数的事，都在硬件方面，你还说它干嘛？难道，你想设计 CPU 中的硬件？你如果学了计算机专业，就认真学习各种编程语言吧。研制硬件？　想都别想！
什么是浮点数？
wushenjian: 这个错地方可把我这个新手害惨了，我还以为我没看懂
计算机时间到底是怎么来的？程序员必看的时间知识！
月姐烤冷面: 写的真好点个赞
什么是定点数？
blue0751: 111是2^0+2^1+2^2=7，但0.111是2^(-1) + 2^(-2) + 2^(-3) = 0.5+0.25+0.125 = 0.875

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。