Scrapy框架爬虫学习--3

继上一节课爬取到了数据之后,这一节将数据入库。

因为python自带了 SQLite/seklait/  数据库,直接用就可以。

1. 新建 SQLite 数据库

在pycharm下进入Terml,然后进入ipython模式,之后

import sqlite3

zufang = sqlite3.connect('zufang.sqlite')   

create_table = 'create table zufang ( title varchar(512), money varchar(128) )'

zufang.execute(create_table)    #实际上就是这个语句

再退出  Term,就可以看到,建立了数据库。可以在database中看到这个数据中的表单以及字段。



2. 爬取来的数据插入数据库

这里分为两个步骤:1)数据通过Items传入Pipelines

                               2)通过Pip传入数据库

1) 先看传入Pip。

首先,要更改settings.py  将注释掉的Items,去注释。注意这里名字和数字。


然后去Items里面把类改写一下


同时在爬虫脚本中,我们进行引入该item类

    这里注意引用时候的问题,最终我把item脚本复制过去通文件夹目录下  from ..items Import 来做的(讲道理有更好的解决办法,之后再看)

这里改写一点点,然后在Ter中运行爬虫即可。可以发现这时候已经传到Pip里面了(因为已经执行了Pip中的Print语句)


剩下的明天写。

2) 从Pip入数据库

这里只需要改Pipeline脚本中的代码即可,将数据入库。


这里共定义了3个函数,其中第二个是从iitem传入函数,这个函数之前就写好了

只需要写第一个链接和第三个关闭函数。

之后就可以看到数据库中插入了我们爬来的数据




整个框架就做完了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值