Scrapy框架详解1，爬虫0基础入门看懂无压力(有问题可私信)

码农小帅

已于 2022-03-28 16:17:18 修改

阅读量175

点赞数

文章标签：爬虫网络爬虫 python

于 2022-03-28 16:12:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68102573/article/details/123797839

版权

本文详细介绍了Scrapy爬虫框架，包括其作为Python开发的网页抓取工具的主要特点，安装步骤（Windows、Ubuntu）以及运行流程。数据流从引擎开始，通过调度器、下载器、爬虫、中间件和管道，形成一个完整的抓取和处理过程。文章还提到了Scrapy的组件，如引擎、调度器、下载器、爬虫、管道以及中间件的作用。

摘要由CSDN通过智能技术生成

简介

Scrapy是纯Python开发的一个高效,结构化的网页抓取框架；

Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，也可以应用在获取API所返回的数据(例如 Amazon Associates Web Services ) 或者通用的网络爬虫。 Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试 Scrapy使用了Twisted 异步网络库来处理网络通讯。

使用原因：

1.为了更利于我们将精力集中在请求与解析上
2.企业级的要求

安装

scrapy支持Python2.7和python3.4以上版本。
python包可以用全局安装(也称为系统范围),也可以安装在用户空间中。

Windows

一.直接安装
1. 在https://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载对应的Twisted的版本文件
2. 在命令行进入到Twisted的目录执行pip install +Twisted文件名
3. 执行pip install scrapy
二.annaconda 下安装
1. 安装conda
  
  conda旧版本 https://docs.anaconda.com/anaconda/packages/oldpkglists/
  安装方法 https://blog.csdn.net/ychgyyn/article/details/82119201
2. 安装scrapy conda install scrapy

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy框架详解1，爬虫0基础入门看懂无压力(有问题可私信)

想要快速弄懂Scrapy框架？看这一篇就够了，少走弯路。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。