Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,
我们只需要实现少量的代码,就能够快速的抓取。
scrapy的三个内置对象
request请求对象:由url method post_data headers等构成
response响应对象:由url body status headers等构成
item数据对象:本质是个字典
五个核心模块和2个中间件
scrapy 流程图
Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,
我们只需要实现少量的代码,就能够快速的抓取。
scrapy的三个内置对象
request请求对象:由url method post_data headers等构成
response响应对象:由url body status headers等构成
item数据对象:本质是个字典
五个核心模块和2个中间件
scrapy 流程图