概述
Scrapy是一款不可多得的经典爬虫框架,用过的人都说好!学完本节内容你能使用该框架开发出一款实用的 文章内容,图片下载,数据存储 ,高效率的 爬虫 。
详细
1.使用说明
目标 : 学完本节内容你能使用该框架开发出一款实用的 文章内容,图片下载,数据存储 ,高效率的 爬虫 。
2.运行的环境
win7(64位)+scrapy2.2.1
3.安装Scrapy
pip install scrapy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
4.新建scrapy项目(项目路径自定,假如存放D盘)
a.打开命令窗口,cd 到 D盘,输入命令 scrapy startproject Bird ,回车执行,效果如下图 (两张图片):
5.进入项目文件 :cd Bird,然后创建爬虫入口文件
a. scrapy genspider search xxxx.com , 回车执行,效果如下图 (两张图片):
6.编写items.py文件
a.items.py,这是创建容器的地方,爬取的信息分别放到不同容器里
b.修改items.py文件存放爬虫信息