Scrapy框架-ItemPipeline的用法
ItemPipeline的用法主要功能:核心方法ItemPipeline实例构造请求提取信息存储信息MongoDBMySQL主要功能:清理HTML数据验证爬取数据,检查爬取字段查重并丢弃重复内容将爬取结果保存到数据库核心方法process_ittem(必须实现的方法)open_spider(spider):spider开启时自动调用close_spider(spider)from_crawler(cls,crawler):是一个类方法,用@classmethod标识,是一种依赖注入




