Scrapy内置了一些简单的存储方式,生成一个带有爬取数据的输出文件,通常叫输出 feed,支持多种序列化格式。
自带支持的类型有:
json,jsonlines,csv,xml,marshal,pickle
cmd进入项目位置 然后输入
scrapy crawl ProjectName -o FileName.json
Scrapy内置了一些简单的存储方式,生成一个带有爬取数据的输出文件,通常叫输出 feed,支持多种序列化格式。
自带支持的类型有:
json,jsonlines,csv,xml,marshal,pickle
cmd进入项目位置 然后输入
scrapy crawl ProjectName -o FileName.json