Scrapy爬虫框架搭建及pycharm中scrapy插件配置

本文介绍了Scrapy爬虫框架,它是一个用于数据抓取和处理的Python应用框架。详细讲述了如何在命令行安装Scrapy及其依赖,如Twisted和lxml,并在Pycharm中设置Scrapy环境,包括解决Pycharm安装Scrapy插件失败的问题。
摘要由CSDN通过智能技术生成

Scrapy爬虫框架简介

Scrapy 是python实现爬取网站数据,提取结构性数据而编写的应用框架,可用于广泛的应用程序,如数据挖掘、信息处理或历史存档。 它使用 Twisted 包(基于事件驱动的网络引擎包)高效地处理网络通信,使用 lxml 、 cssselect 高效提取 HTML 页面, 同时也提供了有效的线程管理。

Scrapy安装

可以在命令行使用pip进行安装:

pip3 install scrapy

直接使用pip安装时,可能会安装失败,因为Scrapy需要大量的第三方依赖包。比如:Twisted, lxml, pyOpenSSL, pywin32等。

首先,我们安装wheel,因为后续安装文件都是whl。

pip3 install wheel

接下来,下载依赖包。去依赖库 下载。

  1. Twisted 依赖包: (cp37 表示 python 版本 3.7 版本, win32/64 根据自己 windows 系统选择)
    Twisted‑19.2.1‑cp37‑cp37m‑win_amd64.whl

下载完成后,在命令行进入下载路径,再使用pip进行安装:

pip3 install Twisted‑

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值