#关于管道查询学习笔记
引入库文件
import pymongo
如果没有安装库,可以pip install pymongo 进行安装
链接数据库
#链接数据库,指定ip和端口
myclient=pymongo.MongoClient('localhost',27017)
查看数据库和集合
# 查看数据库 list_database_names
dbs=myclient.list_database_names()
dbs
['Employcc', 'admin', 'c4', 'config', 'local', 't']
# 切换/创建(本身不存在)数据库
mydb=myclient['test']#切换到数据库test
#查看test数据库中的所有集合
cols=mydb.list_collection_names()
cols
[]
# 直接切换/创建集合
c1=mydb['c1']
# 显示创建、删除集合
mydb.create_collection("c2")
mydb.drop_collection("c2")
{'nIndexesWas': 1, 'ns': 'test.c2', 'ok': 1.0}
文档的增删改查
myclient=pymongo.MongoClient('localhost',27017)
mydb=myclient['test']#切换到数据库test
c1=mydb['c1']
#打印文档
for i in c1.find():
print(i)
增
单文档插入 insert_one
d1={"name":"kjfd","age":18,"major":"大数据技术"}# 在python中,key(字段)必须用双引号括起来
x=c1.insert_one(d1)
print(x.inserted_id)#打印_id
664c4810a837f0aa8e0a2e73
#查询c1文档
for i in c1.find():
print(i)
{'_id': ObjectId('664c4810a837f0aa8e0a2e73'), 'name': 'kjfd', 'age': 18, 'major': '大数据技术'}
多文档插入 insert_many
#多文档插入,参数为列表(数组)
d2=[
{"name":"jasgdk","age":14,"major":"大数据技术"},
{"name":"kadd","age":49,"major":"大数据技术"},
{"name":"kagd","age":20,"major":"人工智能"}
]
x=c1.insert_many(d2)
print(x.inserted_ids)#打印多文档_id
[ObjectId('664c4a79a837f0aa8e0a2e74'), ObjectId('664c4a79a837f0aa8e0a2e75'), ObjectId('664c4a79a837f0aa8e0a2e76')]
查
# 按条件查询c1文档
#find()第一个参数为查询条件,第二个参数为(不)显示的列
for i in c1.find({"major":"大数据技术"},{"_id":0}):
print(i)
{'name': 'kjfd', 'age': 18, 'major': '大数据技术'}
{'name': 'jasgdk', 'age': 14, 'major': '大数据技术'}
{'name': 'kadd', 'age': 49, 'major': '大数据技术'}
# 按修饰符进行查询
q={"age":{"$gt":20}}#查询条件,age大于20
for i in c1.find(q,{"_id":0}):
print(i)
{'name': 'kadd', 'age': 49, 'major': '大数据技术'}
#正则匹配 $regex,查询name以k开头的所有文档
q1={"name":{"$regex":"^k"}}
for i in c1.find(q1,{"_id":0}):
print(i)
{'name': 'kjfd', 'age': 18, 'major': '大数据技术'}
{'name': 'kadd', 'age': 49, 'major': '大数据技术'}
{'name': 'kagd', 'age': 20, 'major': '人工智能'}
管道查询
#在python中管道必须为list形式,所以要用[括起来]
pin=[
{"$group":{"_id":"$major","max_age":{"$max":"$age"}}}
]
# 返回结果为列表,循环打印
result=c1.aggregate(pin)
for i in result:
print(i)
{'_id': '大数据技术', 'max_age': 49}
{'_id': '人工智能', 'max_age': 20}
按照major分组,统计年龄平均值,并统计每个分组文档数,按照平均年龄降序排序
pin1=[
{"$group":{"_id":"$major","avg_age":{"$avg":"$age"},"count":{"$sum":1}}},
{"$sort":{"avg_age":-1}}
]
#返回结果为列表,循环打印
result=c1.aggregate(pin1)
for i in result:
print(i)
{'_id': '大数据技术', 'avg_age': 27.0, 'count': 3}
{'_id': '人工智能', 'avg_age': 20.0, 'count': 1}
更(更新)
更新单个文档update_one
c1=mydb['c1']
for d in c1.find({},{"_id":0}):
print(d)
{'name': 'kjfd', 'age': 18, 'major': '大数据技术'}
{'name': 'jasgdk', 'age': 14, 'major': '大数据技术'}
{'name': 'kadd', 'age': 49, 'major': '大数据技术'}
{'name': 'kagd', 'age': 20, 'major': '人工智能'}
#name为aa3的文档,年龄改为77, $set--修改列值
c1.update_one({"name":"aa3"},{"$set":{"age":77}})# 第一个参数为查询条件,参数2为修改表达式
#查询验证
for d in c1.find({"name":"aa3"},{"_id":0}):
print(d)
更新多个文档uodata_many:更新找到的所有文档
#更新major为大数据技术的文档中的年龄字段,全部加5岁--$inc
q={"major":"大数据技术"}#条件
n_d={"$inc":{"age":5}}#新数据
c1.update_many(q,n_d)
for i in c1.find({},{"_id":0}):
print(i)
{'name': 'kjfd', 'age': 23, 'major': '大数据技术'}
{'name': 'jasgdk', 'age': 19, 'major': '大数据技术'}
{'name': 'kadd', 'age': 54, 'major': '大数据技术'}
{'name': 'kagd', 'age': 20, 'major': '人工智能'}
删除
删除单个文档- -delete_one:删除匹配上的第一个文档
# 删除name为aa2的文档
c1.delete_one({"name":"aa2"})#参数为匹配条件
for i in c1.find({},{"_id":0}):
print(i)
{'name': 'kjfd', 'age': 23, 'major': '大数据技术'}
{'name': 'jasgdk', 'age': 19, 'major': '大数据技术'}
{'name': 'kadd', 'age': 54, 'major': '大数据技术'}
{'name': 'kagd', 'age': 20, 'major': '人工智能'}
删除多个文档-delete_many:删除匹配上的文档
# 删除name以k开头的文档,需要使用正则表达式匹配\
c1.delete_many({"name":{"$regex":"^k"}})
for i in c1.find({},{"_id":0}):
print(i)
{'name': 'jasgdk', 'age': 19, 'major': '大数据技术'}
删除所有文档–delete many–查询条件为空即可
其他
# 排序--sort()
for i in c1.find({},{"_id":0}).sort("age",1):
print(i)
{'name': 'jasgdk', 'age': 19, 'major': '大数据技术'}
# 限制返回数--limit():只返回指定个数的文档
for i in c1.find({},{"_id":0}).limit(1):
print(i)
{'name': 'jasgdk', 'age': 19, 'major': '大数据技术'}
# 跳过--skip():跳过指定的文档数,返回剩下的文档
for i in c1.find({},{"_id":0}).skip(2):
print(i)