Scrapy——初识

最新推荐文章于 2023-12-23 22:51:09 发布

Mrkang1314

最新推荐文章于 2023-12-23 22:51:09 发布

阅读量188

点赞数

分类专栏： python爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mashaokang1314/article/details/82667687

版权

python爬虫专栏收录该内容

21 篇文章 1 订阅

订阅专栏

什么是Scrapy?
Scrapy是一个健壮的网络框架，它可以从各种数据源中抓取数据。以健壮又有效的方式抽取大量数据。
优势

使用Scrapy，你只需一个简单的设置，就能完成其他爬虫框架中需要很多类、插件和配置才能完成的工作。
允许将数据清洗、格式化、装饰化以及将这些数据存出道数据库中等操作级联起来。
由于Scrapy是基于事件的，这就能够让我们在拥有上千个打开的链接时，可以通过平稳的操作拆分吞吐量的延迟。

对Scrapy的正确理解

Scrapy不是Apache Nutch，也就是说，它不是一个通用的网络爬虫。Scrapy是用于提取结构化信息的，需要人工介入，设置合适的XPath或CSS表达式。而Apache Nutch则是获取通用页面并从中提取信息。
它与搜索引擎无关。
它不是类似于MySQL、MongoDB或者Redis的数据库。它既不存储数据，也不索引数据。它只用于抽取数据。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Scrapy——初识

什么是Scrapy? Scrapy是一个健壮的网络框架，它可以从各种数据源中抓取数据。以健壮又有效的方式抽取大量数据。优势使用Scrapy，你只需一个简单的设置，就能完成其他爬虫框架中需要很多类、插件和配置才能完成的工作。允许将数据清洗、格式化、装饰化以及将这些数据存出道数据库中等操作级联起来。由于Scrapy是基于事件的，这就能够让我们在拥有上千个打开的链接时，可以通过平稳的操作...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。