Scrapy 框架实践爬虫--实践篇二

本文是Scrapy框架实践爬虫的第二部分,主要讲解如何将爬取的数据转化为对象并存储到MySQL数据库中。首先创建Item定义数据结构,然后利用pipeline处理数据,通过pymsql库连接MySQL,建立数据表,并编写数据库操作类,实现数据插入和检查。最后,在settings文件中配置启用的pipelines。
摘要由CSDN通过智能技术生成

Scrapy 框架实践爬虫–实践篇二

在之前从网页解析出了我们想要的数据详情请看 Scrapy 框架实践爬虫–实践篇, 趁热打铁 , 接下来就是将数据储存在本地数据库中。

1.将数据转化为对象进行储存

前面提到过 , 在 Scrapy 中通过 pipeline 进行储存。当然现在还没有创建存储的类 , 所以在操作 pipeline 之前 , 先创建一个 item。

class DscrapyItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    # 小说名称
    name = scrapy.Field()
    # 小说链接
    url = scrapy.Field()
    # 小说id
    number = scrapy.Field()
    # 小说类型
    category = scrapy.Field()
    # 作者
    author = scrapy.Field()
    # 小说状态
    status = scrapy.Field()
    # 收藏数
    collect = scrapy.Field()
    # 小说字数
    novelNumber = scrapy.Field()
    # 最后更新时间
    lastUpTime = scrapy.Field()
    # 点击数
    click = scrapy.Field()
    # 推荐数
    <
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值