pycharm编写简单scrapy爬虫并将数据写入sqlite

一、写一个简单爬虫(以爬虫“7d”为例)
1、在项目存放目录下进入终端输入scrapy startproject spider(项目名,随便取)
2、打开pycharm->file->open打开项目,在spiders文件夹下新建python文件,开始编写爬虫(spiders文件夹里专门存放爬虫)以下代码只是参考,后面写入数据库的不是这个爬虫获取的信息。
中国天气网爬取最近七天天气
3、在terminal输入scrapy list查看爬虫个数,输入scrapy crawl 爬虫名(即上图的name值)运行爬虫。

二、连接sqlite数据库,并将数据写入(以爬虫“zufang”为例)
1)创建数据库
1、在终端输入ipython,回车
2、继续输入import sqlite3,回车
3、继续输入zufang = sqlite3.connect(‘zufang.sqlite’),回车,等号左边的是项目名(好像,我也不是很清楚。。。
4、继续输入create_table = ‘create table (title varchar(512), money varchar(128))’,回车
5、继续输入zufang.ececute(create_table),回车
6、终端返回cursor
7、继续输入exit,回车
至此数据库创建完毕,并且建立一张zufang表
可以看到和scrapy.cfg同级目录的一个sqlite文件,打开右侧数据库,将此文件拖入,刷新,可以看到该表格,里面没有内容。
下图是给一中的天气爬虫连接数据库,可以作为参考。
爬取七天天气的表

2)编写代码
1、编写爬虫“zufang”,放在spiders文件夹下
爬虫“zufang”
跟上面的爬虫比①增加了一个item class的导入和item.py文件内类的实例zf②改变了for循环的写法,把爬到的内容写到item中,通过item传到pipeline中写入数据库

2、在settings里找到ITEM_PIPLINES,解除注释
settings.py
3、items.py相应class下增加两个参数,这两个参数就是传给pipelines然后写入sqlite的两个字段
items.py
4、编写pipelines文件
pipelines.py
数据库写入之后要关闭

5、在终端输入scrapy crawl zufang,运行爬虫,看到数据打印到终端(因为pipelines里写了print)
终端输出所爬数据
6、完结撒花!!!租房代码是跟着网易云课堂的小布老师的scrapy基础课程写的,很棒的课程!
这篇文章记录一下简单爬虫的基本步骤,欢迎大佬指正!

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值