scrapy与mongodb数据库

最新推荐文章于 2024-05-19 16:47:54 发布

wapecheng

最新推荐文章于 2024-05-19 16:47:54 发布

阅读量762

点赞数

分类专栏：学习笔记文章标签： mongo scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wapecheng/article/details/95506855

版权

本文介绍了如何在Windows上安装和配置MongoDB服务，包括创建数据库文件夹、启动服务和设置环境变量。接着讲解了如何在Scrapy中使用MongoDB存储爬取的数据，提到了在pipeline.py中处理数据的步骤，并简单概述了Python中使用pymongo库与MongoDB交互的基本操作，如建立连接、插入和查询文档。

摘要由CSDN通过智能技术生成

安装mongodb

软件的下载：
http://dl.mongodb.org/dl/win32/x86_64
选择适合自己电脑的版本进行下载，建议3.4版本
下载之后傻瓜式安装，可以自定义安装位置。

开启数据库

因为启动mongodb服务之前需要必须创建数据库文件的存放文件夹，否则命令不会自动创建，而且不能启动成功。

在3.4文件夹下，新建data文件夹，在data文件下新建db文件夹
指定db目录并启动服务
在命令行窗口中，首先来到MongoDB安装路径下的bin目录，然后输入命令：mongod --dbpath D:\MongoDB\Server\3.4\data\db即可启动MongoDB数据库。
在浏览器中查看数据库是否连接成功
在浏览器输入http://localhost:27017 （27017是mongodb的端口号）查看，若显示下图：

则表示连接成功。如果不成功，可以查看端口是否被占用。
当然，我们也可以新打开一个命令行窗口进行数据库操作，如下图所示。（注：当前启动的数据库窗口不要关闭）
进入MongoDB的bin目录下输入mongo即可进入数据库内。
在这里插入图片描述

配置本地windows mongodb 服务

每次想要使用MongoDB的时候都要进入bin目录先开启服务再运行MongoDB，这样比较麻烦，可以保持MongoDB服务常开以及将mongo加入到环境变量中，可以在任何位置打开MongoDB。
具体过程如下，很简单
1.先在data文件下创建一个新文件夹log（用来存放日志文件）
2.在Mongodb新建配置文件mongo.config用记事本打开mongo.config文件，然后输入：

dbpath=D:\MongoDB\Server\3.4\data\db
logpath=D:\MongoDB\Server\3.4\data\log\mongo.log

3.配置win

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

wapecheng CSDN认证博客专家 CSDN认证企业博客

码龄6年

53: 原创

5万+: 周排名

230万+: 总排名

21万+: 访问

: 等级

1738: 积分

96: 粉丝

229: 获赞

50: 评论

1261: 收藏

私信

关注

热门文章

分类专栏

学习笔记 57篇
学习讲义 1篇

最新评论

HTTP协议详解--请求与响应
晴天阿良: 可靠性：TCP 提供可靠的数据传输，确保数据准确无误地到达目的地，这对于 HTTP 这种要求数据准确的协议非常重要。连接管理：TCP 支持连接的建立和维护，能够保证数据的有序传输，而 UDP 则不具备这些功能。流量控制和拥塞控制：TCP 可以进行流量控制和拥塞控制，避免网络拥塞和数据丢失，提高网络效率。
pyspark入门教程
Riven840: 我一套流程下来全都正常，最后测试程序还是显示No module named 'pyspark'
clickhouse基础教程
　　　 :
pyspark入门教程
梦梦0102: 博主，请问测试的时候一直报这样的错是因为什么啊
pyspark入门教程
梦梦0102: [code=python] [/code] Setting default log level to "WARN". To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel). 23/05/15 22:29:23 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 23/05/15 22:29:24 WARN Utils: Service 'SparkUI' could not bind on port 4040. Attempting port 4041. 23/05/15 22:29:27 ERROR Executor: Exception in task 0.0 in stage 0.0 (TID 0) java.io.IOException: Cannot run program "python3": CreateProcess error=2, 系统找不到指定的文件。 at java.base/java.lang.ProcessBuilder.start(ProcessBuilder.java:1140) at java.base/java.lang.ProcessBuilder.start(ProcessBuilder.java:1074) at org.apache.spark.api.python.PythonWorkerFactory.createSimpleWorker(PythonWorkerFactory.scala:170) at org.apache.spark.api.python.PythonWorkerFactory.create(PythonWorkerFactory.scala:109)

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。