1.7 scrapy基本使用流程实例

# 主要命令

scrapy startproject 项目名

scrapy  genspider 爬虫名  网站域名

scrapy crawl 爬虫名

1. 安装scrapy库

pip install scrapy

2.创建文件夹并打开进入当前目录

d65dd3768ec64a498f9b66f41a5dcb70.png

3.使用流程

1)创建项目 scrapy startyproject 项目名

96d192d0d6784fe5a2dadc49ba8a29ca.png

2)生成爬虫

需进入项目的路径再生成

scrapy genspider  爬虫名 爬取的域名

d86a16f1b972409d8d02937c85b1e829.png

3)对setting.py 进行基本配置

设置日志级别和robots rules

40bea980f3cc438ca5c51013c67553ca.png

取消注释并添加UA

394bb17e646c4e6a94b7195faebd5db2.png

 

4.演示爬虫4399页面数据

打开spider目前下的爬虫py并修改

打开终端执行 scrapy crawl 爬虫名

2400cdfc7d3c42d790eeb0b03e2d59c5.png

 

5.对获取数据进行处理

101d1c4b0f4947fdbea5ab10cd4202f8.png

6.pipeline存储

开启pipeline 到settings.py 取消注销

设置优先级

优先级越小越优先

0029186aa1af4893804f9a79d842fad9.png

 

如图下执行优先级小的

WengPipeline是进行重写

7295567af77346f2beeacd3fa72fe61d.png

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值