【python爬虫专项(17)】如何通过python使用MongoDB(pandas与mongo的交互)

核心工具包:pymongo

python通过pymongo来连接mongo

pymongo安装

命令提示符中安装:pip install pymongo
查看安装版本:pip show pymongo
在这里插入图片描述

创建MongoClient对象,连接mongo

1) 创建对象
myclient = pymongo.MongoClient(“mongodb://localhost:27017/”)

2)查看现有数据库
list_database_names()

3)读取数据库
db = myclient[数据库名]

示例
在这里插入图片描述

查询集合、文档

1)查看现有集合
db.list_collection_names()

2)读取集合
data = db[集合名]

示例
在这里插入图片描述
3)查询文档
查询单条数据: find_one() → 输出字典
查询所有数据: find({}) → 输出可迭代对象<class ‘pymongo.cursor.Cursor’>

示例
查找一条数据
在这里插入图片描述
查找多条数据
在这里插入图片描述
也可以把多条数据存成dataframe格式的数据,直接进行数据分析
在这里插入图片描述

插入文档

插入单个文档:insert_one()
插入多个文档:insert_many() → 通过字典列表插入

示例
在这里插入图片描述

删除集合、文档

1)删除文档
删除一个文档:delete_one()
删除多个文档:delete_many()
如果传入的是一个空的查询对象,则会删除集合中的所有文档

示例
删除单条数据
在这里插入图片描述
删除多条数据
在这里插入图片描述
删除所有数据
在这里插入图片描述
2)删除集合
drop()

示例
在这里插入图片描述

pandas如何配合mongo:

1)通过查询的方式,将数据存成dataframe(刚刚已经尝试过了)

示例
在这里插入图片描述
2)dataframe通过.to_dict()方法输出字典列表,再通过insert_many()导入数据库

DataFrame.to_dict(orient=’’),orient参数如下,这里建议用’records’
        ‘dict’ (default) : dict like {column -> {index -> value}}
        ‘list’ : dict like {column -> [values]}
        ‘series’ : dict like {column -> Series(values)}
        ‘split’ : dict like {‘index’ -> [index], ‘columns’ -> [columns], ‘data’ -> [values]}
        ‘records’ : list like [{column -> value}, … , {column -> value}]
        ‘index’ : dict like {index -> {column -> value}}

示例
在这里插入图片描述
注意:
数据修改、处理、分析,都在pandas中执行
数据爬取过程中,以字典方式存储每一条数据,可以直接通过insert_one()插入数据库中

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值