Scrapy 框架实践爬虫–实践篇二
在之前从网页解析出了我们想要的数据详情请看 Scrapy 框架实践爬虫–实践篇, 趁热打铁 , 接下来就是将数据储存在本地数据库中。
1.将数据转化为对象进行储存
前面提到过 , 在 Scrapy 中通过 pipeline 进行储存。当然现在还没有创建存储的类 , 所以在操作 pipeline 之前 , 先创建一个 item。
class DscrapyItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
# 小说名称
name = scrapy.Field()
# 小说链接
url = scrapy.Field()
# 小说id
number = scrapy.Field()
# 小说类型
category = scrapy.Field()
# 作者
author = scrapy.Field()
# 小说状态
status = scrapy.Field()
# 收藏数
collect = scrapy.Field()
# 小说字数
novelNumber = scrapy.Field()
# 最后更新时间
lastUpTime = scrapy.Field()
# 点击数
click = scrapy.Field()
# 推荐数
<