此博客是在学习崔庆才《Python3 网络爬虫开发实战》中的笔记总结。在开始学习之前,请确保安装好了MongoDB数据库并且保证数据库能够正常运行,并且需要安装好pymongo库
目录
1 连接MongoDB
使用pymongo库里面的MongoClient连接MongoDB。需要传入MongoDB的IP及端口
其中第一个参数为地址host,第二个参数为端口port(如果不传递参数,默认为27017)
import pymongo
client=pymongo.MongoClient(host='localhost',port=27017)
另外也可使用此方法连接MongoDB,MongoClient的第一个参数host还可以直接传入MongoDB的连接字符串,以mongodb开头
client=MongoClient('mongodb://localhost:27017/')
两种方法可以达到同样的连接效果
2 指定数据库
在实际操作中我们需要指定操作那个数据库,这里我们用test数据库为例说明,在程序中指定要使用的数据库,:
db=client.test
这里调用client的test属性即可返回test数据库。当然,也可以这样指定
db=client['test']
这样我们就指定了一个数据库,这两种方法是等价的。如果数据库不存在,则创建数据库,否则切换到指定数据库。
3 指定集合
MongoDB的每个数据库包含许多集合(collection),集合类似关系型数据库中的表。
指定要操作的集合,这里指定一个集合名称为students。与指定数据库类似,有两种指定方式。
collection=db.students
collection=db['students']
这样我们便声明了一个Collection对象,这两种方法是等价的。如果集合不存在,则创建集合,否则切换到指定集合。
4 插入数据
接下来对集合students进行插入数据操作,新建一条以字典形式表示的学生数据
student={
'id':'1',
'name':'林先生',
'age':20,
'gender':'male'
}
指定了学生的学号、姓名、年龄和性别。接下来调用collection的insert()方法插入数据,代码如下: