# 主要命令
scrapy startproject 项目名
scrapy genspider 爬虫名 网站域名
scrapy crawl 爬虫名
1. 安装scrapy库
pip install scrapy
2.创建文件夹并打开进入当前目录
3.使用流程
1)创建项目 scrapy startyproject 项目名
2)生成爬虫
需进入项目的路径再生成
scrapy genspider 爬虫名 爬取的域名
3)对setting.py 进行基本配置
设置日志级别和robots rules
取消注释并添加UA
4.演示爬虫4399页面数据
打开spider目前下的爬虫py并修改
打开终端执行 scrapy crawl 爬虫名
5.对获取数据进行处理
6.pipeline存储
开启pipeline 到settings.py 取消注销
设置优先级
优先级越小越优先
如图下执行优先级小的
WengPipeline是进行重写