python爬虫scrapy连接mongodb_Scrapy爬虫之MongoDB数据存储

原标题:Scrapy爬虫之MongoDB数据存储

在开始代码之前,还没有安装过MongoDB的朋友,可以先去官网下载并安装。MongoDB下载官网:https://www.mongodb.com/download-center;安装和使用教程:

http://www.runoob.com/mongodb/mongodb-window-install.html.安装和配置完成后,因为权限不足的问题,需要在管理员模式下启动MongoDB,MongoDB的开启方法已在使用教程中展示,如下图所示.

Python学习资料或者需要代码、视频加Python学习群:960410445

5e61c1f10bdd40afbecb0372afe80f95.png

然后打开任意浏览器,输入地址:http://localhost:27017,如果一切正常,如下图所示,表示MongoDB数据正常使用.

9aad7075d2b443e8aed09f412bbb6fa6.png

启动MongoDB后,创建爬虫工程,以lagou为例,具体代码如下:

编写lagourecruit.py文件

12626775e326403b825f34df5e150c81.png

e0a6b80b21664a00905a0359df18e5bf.png

编写items.py文件

b3e1097d032e4d8b8f118a0c1f85c7d1.png

编写setting.py文件,同时设置好自己的User-Agent

3a5349a7434b4c3ea35b12f86bb755e2.png

编写pipelines.py文件

dcd9e7bf8daa4e048237bad1116fa55e.png

编写start.py文件

6fd42620683f4f489d6dc74b2e944447.png

执行start.py脚本(ps:在这里小编只展示一部分)

07f06936d04b4f0d910e37b5026839d8.png

在MongoDB启动的状态下,数据已成功写入到数据库中,小编向大家展示两种数据库的查阅方式。

方式一:另外打开一个以管理员身份运行的cmd窗口,进入到MongoDB安装盘的mongodb\bin文件目录下,输入mongo命令,小编这里以F盘为例,如下图所示.

1810c43c8744480ea7fd39a50286ade4.png

完成之后,输入use+工程名(如use lagou),接着输入查看数据库命令:show collections,再输入db.数据库名称.find()(如db.lagourecruit.find())查看数据库内容,如下图所示.

4b6b9e508dbb432da14ac45794370d94.png

方式二:利用MongoDB可视化工具RoboMongo,RoboMongo下载地址:

http://www.softpedia.com/get/Internet/Servers/Database-Utils/Robomongo.shtml#download,安装完成并打开,建立主机连接,如下图所示.

9e7034a50917409cad4691c0ad7d29b4.png

连接成功后,即可查阅数据库内容,如下图所示.

bdf6ea4640174fd18577788d8da21b71.png

a56f94599abd49a199a4c7ed2871706f.png

责任编辑:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值