Python:Scrapy框架安装、Scrapy项目构建

==== 重要事情放在前面,到18年12月4日止,亲测最稳定的python版本,3.6.4。====

一、终端下安装:pip install scrapy

1、打开cmd,先看看pip list,如果没有Twist、pywin32进行安装

在这里插入图片描述
pip install pywin32
pip install Twist

2、然后执行pip install scrapy

在这里插入图片描述
安装Scrapy,极其可能报错

3、安装过程中,Twist安装容易报错(可能不报错)

(1)安装不上,不急

如果没有出现以上错误,恭喜你

大多数出现以上错误,那么接着一步步去,尝试下载安装二进制版本的包
在这里插入图片描述

(2)处理Twist错误

在这里插入图片描述

(3)上图列表显示cp36,对应下载36 :

https://www.lfd.uci.edu/~gohlke/pythonlibs/#Twisted?tdsourcetag=s_pcqq_aiomsg
在这里插入图片描述

(4)安装:要cmd定位到下载的目录

将Twisted‑18.9.0‑cp36‑cp36m‑win_amd64.whl放在一个已知地址,新打开cmd,cd定位到这个已知地址。

输入pip install Twisted‑18.9.0‑cp36‑cp36m‑win_amd64.whl
在这里插入图片描述

(5)再次安装scrapy

在这里插入图片描述

4、测试安装成功后的结果:

在这里插入图片描述
成功!!!!!!!

总结:

在这里插入图片描述

二、创建scrapy工程:

1、在目标文件夹下运行cmd,或者cmd中CD跳转到目标文件夹

运行Scrapy startproject ----项目名称----
在这里插入图片描述

2、Pycharm 打开这个工程

在这里插入图片描述

3、工程简介

在这里插入图片描述
在这里插入图片描述

三、创建爬虫文件

1、在spiders文件夹中创建爬虫文件

PyCharm 的 Terminal 中输入
scrapy genspider ----爬虫文件名---- ----抓取url----

2、创建结果

在这里插入图片描述
在这里插入图片描述

3、爬取内容检索

在这里插入图片描述

4、运行

PyCharm 的 Terminal 中输入
scrapy crawl ----爬虫文件名---- -o ----存储文件名----

在这里插入图片描述

5、报错处理

在这里插入图片描述

6、设置

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值