一、MongoDB简介
1.概述
MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。
MongoDB介于关系型数据和非关系型数据库之间,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。
MongoDB最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库表单查询的绝大部分功能,而且还支持对数据建立索引。
mysql id name age score 1 lisi 10 80 2 jack 20 75 mongodb { id:1, name:"lisi", age:10, score:80 } #典型的field:value #mongodb会将数据存储为一个文档,数据结构是由field:value的形式组成,mongodb文档类似于json对象【在json数据中,{}代表就是一个json对象】,value取值可以是数字,是字符串,也可以是数组
2.和MySQL之间的区别
2.1MySQL
关系型数据库。
查询语句是使用传统的sql语句,拥有较为成熟的体系,成熟度很高。
关系型数据库遵循ACID规则
开源数据库的份额在不断增加,mysql的份额页在持续增长。
缺点就是在海量数据处理的时候效率会显著变慢。
2.2MongoDB
非关系型数据库(nosql ),属于文档型数据库。先解释一下文档的数据库,即可以存放xml、json、bson类型系的数据。这些数据具备自述性(self-describing),呈现分层的树状数据结构。数据结构由键值(key=>value)对组成。
存储方式:虚拟内存+持久化。
查询语句:是独特的Mongodb的查询方式。
适合场景:事件的记录,内容管理或者博客平台等等。
数据处理:数据是存储在硬盘上的,只不过需要经常读取的数据会被加载到内存中,将数据存储在物理内存中,从而达到高速读写。
成熟度与广泛度:新兴数据库,成熟度较低,Nosql数据库中最为接近关系型数据库,比较完善的DB之一,适用人群不断在增长。
优势:
快速!在适量级的内存的Mongodb的性能是非常迅速的,它将热数据存储在物理内存中,使得热数据的读写变得十分快,
高扩展!
自身的Failover机制!
json的存储格式!
2.3二者之间的区别
SQL命令 MongoDB命令 解释 database database 数据库 table collection 数据表/集合 row document 数据记录行/文档 column field 数据字段列/字段 join 不支持 表连接 primary key primary key 主键
二、MongoDB安装和卸载
1.卸载
执行命令: sudo apt-get autoremove mongodb sudo apt-get autoclean mongodb #清除残留数据 dpkg -l |grep ^rc|awk '{print $2}' |tr ["\n"] [" "]|sudo xargs dpkg -P
2.安装
第1步 – 导入公钥**
Ubuntu软件包管理器apt(高级软件包工具)需要软件分销商的GPG密钥来确保软件包的一致性和真实性。 执行此下面的命令将MongoDB密钥导入到您的服务器:
sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 2930ADAE8CAF5059EE73BB4B58712A2291FA4AD5
第2步 – 创建源列表文件MongoDB
检查URL http://repo.mongodb.org/apt/ubuntu/dists/。 如果您在该网页上看到一个目录“bionic”,则将下述命令中的单词“xenial”替换为“bionic”一词,【原因:MongoDB尚未发布Bionic Beaver软件包,但Xenial软件包在Ubuntu 18.04 LTS上运行良好】
执行以下命令在/etc/apt/sources.list.d/中创建一个MongoDB列表文件:
echo “deb http://repo.mongodb.org/apt/ubuntu bionic/mongodb-org/3.6 multiverse” | sudo tee /etc/apt/sources.list.d/mongodb-org-3.6.list
第3步 – 更新存储库
使用apt命令更新存储库:
sudo apt-get update
说明:执行完会提示一些失败,不用在意
第4步 – 安装MongoDB
执行以下命令来安装MongoDB:
sudo apt-get install -y mongodb
问题:如果有进程正在占用【可能上次不正常关机,导致的资源未被释放】
sudo rm /var/cache/apt/archives/lock 删除缓存内容
sudo rm /var/lib/dpkg/lock
第5步:启动MongoDB
执行以下命令启动MongoDB并将其添加为在启动时启动的服务
systemctl start mongodb
如果执行完这一步终端没有任何输出,则说明是正确的 如果启动的时候提示:Failed to start mongod.service: Unit mongodb.service not found. 解决办法如下: 1创建配置文件: 在/etc/systemd/system/下 sudo vim mongodb.service 2.在里面追加文本: [Unit] Description=High-performance, schema-free document-oriented database After=network.target [Service] User=mongodb ExecStart=/usr/bin/mongod --quiet --config /etc/mongodb.conf [Install] WantedBy=multi-user.target 3.按ctrl+X退出 4.启动服务 sudo systemctl start mongodb sudo systemctl status mongodb 5.让它永久启动 sudo systemctl enable mongodb
第6步:检查MongoDB是否已经启动在27017端口号上
执行下面的命令:
netstat -plntu
第7步:登录MongoDB
mongo
如果出现错误全局初始化失败:BadValue无效或无用户区域设置。 请确保LANG和/或LC_ *环境变量设置正确,请尝试命令: export LC_ALL=C mongo
补充:ubuntu下如何查看软件安装目录以及安装版本
1.查询版本 aptitude show 软件名 或者 dpkg -l软件名 2.查询安装路径 dpkg -L 软件名 或者 whereis 软件名
三、MongoDB使用
1.创建和删除数据库
MongoDB本质和MySQL一样,属于数据库管理系统,在其中可以创建多个数据库
MongoDB默认的数据库为db,该数据库存储在data目录下
MongoDB可以容纳多个数据库,每个数据库都有自己的文档和字段,不同的数据库存储在不同的文件下
1.1创建数据库
语法:
use DATABASE_NAME 注意:如果指定的数据库DATABASE_NAME不存在,则该命令将创建一个新的数据库,否则返回现有的数据库 #use xxxx :创建,同时切换到指定的数据库下 #show dbs:查询数据库列表,系统默认的数据库,admin和local #注意1:如果新创建的数据库是空的,则该数据库通过show dbs不会显示,如果想要显示,则必须在其中插入至少一条数据【文档】 db.items.insert({}) 插入到当前数据库 #注意2:在mongo中有一个默认的数据库:test,如果还没有创建任何的数据库或者文档,则默认会将所有信息存储到test中 演示命令: > use mydb1 switched to db mydb1 > db mydb1 > show dbs admin (empty) local 0.078GB > db.items.insert({"name":"zhangsan"}) WriteResult({ "nInserted" : 1 })
1.2删除数据库
语法:
db.dropDatabase() 删除的当前数据库 演示命令: > show dbs admin (empty) local 0.078GB mydb1 0.078GB > db.dropDatabase() { "dropped" : "mydb1", "ok" : 1 } #如果执行完命令出现1,则表示执行成功 > show dbs admin (empty) local 0.078GB > #注意:如果没有use xxx,则直接执行db.dropDatabase(),默认删除的test数据库
2.创建和删除集合
集合:mysql表
集合存在于数据库中,集合没有固定的结构,可以对集合插入各种不同数据类型的数据
集合名的注意事项:
a.集合名不能是空字符串“”
b.集合名中不能包含\0字符,这个字符代表集合名的结尾
c.集合名不能使用"system."开头,都是为系统保留的集合名
d.集合名不能包含保留字【系统的命令】
e.不要出现$
f.建议:英文+数字
2.1创建集合
语法:
db.createCollection(name[, options]) 说明: a.name表示需要创建的集合名称,类型为字符串 b.options是document【一行记录】,可选参数
下面是可以使用的选项列表:
在插入文档时,MongoDB首先检查上限集合
capped
字段的大小,然后检查max
字段。
字段 类型 描述 capped
Boolean
(可选)如果为 true
,则启用封闭的集合。上限集合是固定大小的集合,它在达到其最大大小时自动覆盖其最旧的条目。 如果指定true
,则还需要指定size
参数。autoIndexId
Boolean
(可选)如果为 true
,则在_id
字段上自动创建索引。默认值为false
。size
数字 (可选)指定上限集合的最大大小(以字节为单位)。 如果 capped
为true
,那么还需要指定此字段的值。max
数字 (可选)指定上限集合中允许的最大文档数。
1>不添加options
演示命令 > db.createCollection("myCollection") { "ok" : 1 } > show collections myCollection system.indexes
2>添加options
演示命令: > db.createCollection("myCollection1",{capped:true,autoIndexId:true,size:60000,max:1000}) { "ok" : 1 } > show collections myCollection myCollection1 system.indexes > db.newCollection.insert({"name":"bob"}) WriteResult({ "nInserted" : 1 }) > show collections myCollection myCollection1 newCollection system.indexes #注意:如果没有集合,可以在插入数据的过程中再创建 db.xxxxx.insert({})
2.2删除集合
语法:
db.COLLECTION_NAME.drop() 注意:如果选定的集合成功删除,drop()方法将返回true,否则返回false 演示命令: > show collections myCollection myCollection1 newCollection system.indexes > db.myCollection1.drop() true > show collections myCollection newCollection system.indexes
3.文档操作
注意:
1.一条文档不能有重复的键
2.文档中的键值是有序的
3.区分大小写
4.键命名:常规【英文+数字】
_xxx:键,但是一般是保留键
3.1插入文档
语法:
db.COLLECTION_NAME.insert({document1},{document2}。。。。) #COLLECTION_NAME可以先创建,也可以在插入数据的过程中创建 #db.集合名.find() 查看,相当于mysql中的select * from xxx; #_id和自定义的id没有任何关系,相互不影响,_id的值是由系统按照一定的规律自动分配 { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi", "age" : 37, "comments":[ { "user":"abc", "passwd":"abc124" } ] } #{}:对象 []:数组。只能出现在value中
注意:在插入的文档中,如果不指定_id参数,那么 MongoDB 会为此文档分配一个唯一的ObjectId
_id为集合中的每个文档唯一的12个字节的十六进制数。 12字节划分如下
_id: ObjectId(4 bytes timestamp, 3 bytes machine id, 2 bytes process id, 3 bytes incrementer)
3.2 版本后,其它插入文档的方法【作为了解】
db.collection.insertOne():插入单个文档
db.collection.insertMany():插入多个文档
a.db.collection.insertOne()方法
db.collection.insertOne()
方法将单个文档插入到集合中。 如果文档没有指定
_id字段,MongoDB会自动将
_id字段与
ObjectId`值添加到新文档演示:
#以下示例将新文档插入到库存集合中 db.invent.insertOne({ item: "canvas", num: 100, tags: ["cotton"], size: { h: 20, w: 30, } }) #db.collection.insertOne()方法返回包含新插入的文档的`_id```字段值的文档 执行结果如下: > db.inventory.insertOne( ... { item: "canvas", qty: 100, tags: ["cotton"], size: { h: 28, w: 35.5, uom: "cm" } } ... ) { "acknowledged" : true, "insertedId" : ObjectId("5955220846be576f199feb55") } >
b.db.collection.insertMany()方法
db.collection.insertMany()
方法将多个文档插入到集合中,可将一系列文档传递给
db.collection.insertMany()方法。以下示例将三个新文档插入到库存集合中。如果文档没有指定
_id字段,MongoDB会向每个文档添加一个ObjectId值的
_id`字段演示:
db.inventory.insertMany([ { item: "journal", qty: 25, tags: ["blank", "red"], size: { h: 14, w: 21, uom: "cm" } }, { item: "mat", qty: 85, tags: ["gray"], size: { h: 27.9, w: 35.5, uom: "cm" } }, { item: "mousepad", qty: 25, tags: ["gel", "blue"], size: { h: 19, w: 22.85, uom: "cm" } } ]) #insertMany()返回包含新插入的文档_id字段值的文档。执行结果如下: > db.inventory.insertMany([ ... { item: "journal", qty: 25, tags: ["blank", "red"], size: { h: 14, w: 21, uom: "cm" } }, ... { item: "mat", qty: 85, tags: ["gray"], size: { h: 27.9, w: 35.5, uom: "cm" } }, ... { item: "mousepad", qty: 25, tags: ["gel", "blue"], size: { h: 19, w: 22.85, uom: "cm" } } ... ]) { "acknowledged" : true, "insertedIds" : [ ObjectId("59552c1c46be576f199feb56"), ObjectId("59552c1c46be576f199feb57"), ObjectId("59552c1c46be576f199feb58") ] }
3.2查询文档
语法:
db.COLLECTION_NAME.find(document) #注意:以非结构化的方式显示所有文档 pretty():以结构化【格式化】的方式显示所有文档 演示命令: > db.mycol1.find().pretty() { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "xiaoming", "age" : 37 } { "_id" : ObjectId("5c231e5fbcece7a3e5b64a05"), "id" : 102, "name" : "jack", "age" : 37 } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "id" : 103, "name" : "jack", "age" : 37 } > db.mycol1.find().pretty() { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "xiaoming", "age" : 37 } { "_id" : ObjectId("5c231e5fbcece7a3e5b64a05"), "id" : 102, "name" : "jack", "age" : 37 } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "id" : 103, "name" : "jack", "age" : 37 } 等价sql语句:select * from mycol1;
MongoDB 与 RDBMS的等效MySQL子句
要在一些条件的基础上查询文档,可以使用以下操作:
操作 语法 示例 MySQL等效语句 相等 {<key>:<value>}
db.mycol.find({"by":"yiibai"}).pretty()
where by = 'yiibai'
小于 {<key>:{$lt:<value>}}
db.mycol.find({"likes":{$lt:50}}).pretty()
where likes < 50
小于等于 {<key>:{$lte:<value>}}
db.mycol.find({"likes":{$lte:50}}).pretty()
where likes <= 50
大于 {<key>:{$gt:<value>}}
db.mycol.find({"likes":{$gt:50}}).pretty()
where likes > 50
大于等于 {<key>:{$gte:<value>}}
db.mycol.find({"likes":{$gte:50}}).pretty()
where likes >= 50
不等于 {<key>:{$ne:<value>}}
db.mycol.find({"likes":{$ne:50}}).pretty()
where likes != 50
注意:$gt,$lt等会被识别为键,具体的数据会被识别为value
演示:
a.MongoDB中的AND操作符
语法:
#在find()方法中,如果通过使用’,‘将它们分开传递多个键,则 MongoDB 将其视为AND条件。 以下是AND的基本语法 >db.mycol.find( { $and: [ {key1: value1}, {key2:value2} ] } ).pretty() 演示命令: > db.mycol1.find({$and:[{"name":"lisi","age":37}]}) { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi", "age" : 37 } > db.mycol1.find({$and:[{"name":"lisi","age":37}]}).pretty() { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi", "age" : 37 } #$and可以省略 > db.mycol1.find({"name":"lisi","age":37}).pretty() { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi", "age" : 37 } 等价sql语句:select * from mycol1 where name="lisi" and age=37;
b.MongoDB中的OR操作符
语法:
#在要根据OR条件查询文档,需要使用$or关键字。 以下是OR条件的基本语法 >db.mycol.find( { $or: [ {key1: value1}, {key2:value2} ] } ).pretty() #注意:$or不能省略,如果省略表示就不是or,而是and 演示命令: > db.mycol1.find({$or:[{"name":"lisi","age":37}]}).pretty() { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi", "age" : 37 } 等价sql语句:select * from mycol1 where name="lisi" or age=37;
c.使用 AND 和 OR 联合使用
演示命令: > db.mycol1.find({"age":{$gt:30},$or:[{"name":"lisi"},{"id":101}]}) { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi", "age" : 37 } > db.mycol1.find({"age":{$gt:30},$or:[{"name":"lisi"},{"id":101}]}).pretty() { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi", "age" : 37 } 等价sql语句:select * from mycol1 where age>30 and(name="lisi" or id=101);
3.3更新文档
1>update():更新现有文档中的值
update(指定一个查询条件,指定更新信息,options)
options:可选参数,包含upsert和multi,
upsert:更新数据的时候,如果数据存在则更新,如果不存在则创建数据
multi:是否应该更新所有匹配到的文档,或者只需要更新第一个匹配到的文档【默认行为】
语法:
db.COLLECTION_NAME.update(SELECTION_CRITERIA, UPDATED_DATA) 演示命令: #查询指定的字段列表,则可以通过键值对的方式指定, #{“字段1”:1},1代表显示字段,0表示隐藏字段 > db.mycol1.find({},{"id":1,"name":1}),find函数默认显示所有的字段 { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi" } { "_id" : ObjectId("5c231e5fbcece7a3e5b64a05"), "id" : 102, "name" : "lisi1" } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "id" : 103, "name" : "lisi1" } > 等价sql语句:select id,name from mycol1; > db.mycol1.find({"name":"lisi"},{"id":1,"name":1}) { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "lisi" } 等价sql语句:select id,name from mycol1 where name="lisi"; > db.mycol1.update({"name":"lisi"},{$set:{"name":"xiaoming"}}) WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 }) > db.mycol1.find({"name":"xiaoming"},{"id":1,"name":1}) { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "xiaoming" } > 等价sql语句:update table mycol1 set name="xiaoming" where name="lisi"; #默认只会更新匹配到的第一个文档,如果要更新所有匹配大的文档 > db.mycol1.update({"name":"lisi1"},{$set:{"name":"jack"}},{multi:true}) WriteResult({ "nMatched" : 2, "nUpserted" : 0, "nModified" : 2 }) > db.mycol1.find().pretty() { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 101, "name" : "xiaoming", "age" : 37 } { "_id" : ObjectId("5c231e5fbcece7a3e5b64a05"), "id" : 102, "name" : "jack", "age" : 37 } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "id" : 103, "name" : "jack", "age" : 37 }
2>save():使用
save()
方法中传递的文档数据替换现有文档语法:
db.COLLECTION_NAME.save({_id:ObjectId(),NEW_DATA}) #注意:查询条件时_id【在同一个集合中是唯一的】,更新对应的数据,保存起来 演示命令: > db.mycol1.save({'_id':ObjectId("5c231d94bcece7a3e5b64a04"),'id':108,'name':"bob",'age':15}) WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 }) > db.mycol1.find().pretty() { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 108, "name" : "bob", "age" : 15 } { "_id" : ObjectId("5c231e5fbcece7a3e5b64a05"), "id" : 102, "name" : "jack", "age" : 37 } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "id" : 103, "name" : "jack", "age" : 37 } >
3.4删除文档
MongoDB中的
remove()
方法用于从集合中删除文档。remove()
方法接受两个参数。 一个是删除条件,第二个是标志:justOne
。 criteria - (可选)符合删除条件的集合将被删除。 相当于sql的drop
justOne - (可选)如果设置为
true
或1
,则只删除一个文档语法:
>db.COLLECTION_NAME.remove(查询条件,1或者true) #注意:删除集合还是文档,使用remove(),如果要删除集合,则需要设置criteria参数 演示命令: > db.mycol1.remove({'_id':ObjectId("5c231e5fbcece7a3e5b64a05")}) WriteResult({ "nRemoved" : 1 }) > db.mycol1.find().pretty() { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "id" : 108, "name" : "bob", "age" : 15 } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "id" : 103, "name" : "jack", "age" : 37 } 等价sql语句:delete from mycol1 where _id=ObjectId("5c231f86bcece7a3e5b64a06");
4.查询
4.1投影
语法:
>db.COLLECTION_NAME.find({},{KEY:1}) #1显示,0隐藏 #注意:如果没有显式的写出来的字段,key默认都为0 演示命令: > db.mycol1.find({},{'_id':1,'name':1}) { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "name" : "bob" } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "name" : "jack" } > db.mycol1.find({},{'_id':0,'name':1}) { } { "name" : "bob" } { "name" : "jack" }
4.2限制筛选记录
1>limit方法
限制查询返回的记录条数
语法:
> db.COLLECTION_NAME.find().limit(number) 演示命令: > db.mycol1.find({},{'_id':1,'name':1}).limit(1) { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } > db.mycol1.find({},{'_id':1,'name':1}).limit(2) { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "name" : "bob" }
2>skip方法
skip:跳过,忽略,表示在开始要跳过的文档数量,默认为0
语法:
>db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER) 演示命令: > db.mycol1.find({},{'_id':1,'name':1}).limit(2).skip(1) { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "name" : "bob" } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "name" : "jack" } > db.mycol1.find({},{'_id':1,'name':1}).limit(2).skip(2) { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "name" : "jack" } 等价sql语句:select * from mycol1 limit start,end #db.集合名.find().limit().skip():实现类似mysql中的分页功能
4.3对查询记录排序
语法:
>db.COLLECTION_NAME.find().sort({KEY:1}) #sort({KEY:1}):排序的规则 #1【升序】和-1【降序】 演示命令: > db.mycol1.find({},{'_id':1,'name':1}) { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "name" : "bob" } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "name" : "jack" } > db.mycol1.find({},{'_id':1,'name':1,'age':1}).sort({'age':-1}) { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "name" : "jack", "age" : 37 } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "name" : "bob", "age" : 15 } { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } > db.mycol1.find({},{'_id':1,'name':1,'age':1}).sort({'age':1}) { "_id" : ObjectId("5c231d0bbcece7a3e5b64a03") } { "_id" : ObjectId("5c231d94bcece7a3e5b64a04"), "name" : "bob", "age" : 15 } { "_id" : ObjectId("5c231f86bcece7a3e5b64a06"), "name" : "jack", "age" : 37 } > 等价sql语句:select * from mycol1 order by field asc/desc;
4.4分组与聚合函数查询
1>aggregate()方法
语法:
>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION) #使用aggregate,同时还需要进行分组,参数使用[] 演示命令: #语法:db.mycol.aggregate(分组,使用聚合函数) > db.mycol.aggregate([{$group:{_id:'$by',num_tutorial:{$sum:'$likes'}}}]) { "_id" : "yiibai tutorials", "num_tutorial" : 340 } > 等价的sql语句:select by,sum(likes) from mycol group by [by]
以下是可用聚合表达式的列表。
描述 表达式 示例 从集合中的所有文档中求出定义的值。 $sum
db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
计算集合中所有文档的所有给定值的平均值。 $avg
db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
从集合中的所有文档获取相应值的最小值。 $min
db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
从集合中的所有文档获取相应值的最大值。 $max
db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
将值插入到生成的文档中的数组中。 $push
db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
将值插入生成的文档中的数组,但不会创建重复项。 $addToSet
db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
根据分组从源文档获取第一个文档。 通常情况下,这只适用于以前应用的“ $sort
”阶段。$first
db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
根据分组从源文档获取最后一个文档。通常情况下,这只适用于以前应用的“ $sort
”阶段。$last
db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])
5.MongoDB关联关系
MongoDB中的关系表示各个文档在逻辑上的相互关联。关系可以通过嵌入式和引用方法建模。 这种关系可以是
1:1
,1:N
,N:1
或N:N
。假设有一种情况:要存储用户的地址。一个用户可以拥有多个地址,这就是
1:N
关系。以下是用户(
user
)文档示例的文档结构
{ "_id":10999110, "name": "Maxsu", "contact": "13888990021", "dob": "1992-10-11" }
以下是地址(
address
)文档的示例文档结构 -{ "_id":12200, "building": "Hainan Building NO.2100", "pincode": 571100, "city": "Haikou", "province": "Hainan" }
5.1嵌入式关系建模
在嵌入式方法中,我们将地址(
address
)文档嵌入到用户(user
)文档中。{ "_id": 21000100, "contact": "13800138000", "dob": "1991-11-11", "name": "Maxsu", "address": [ { "building": "Hainan Building NO.2100", "pincode": 571100, "city": "Haikou", "province": "Hainan" }, { "building": "Sanya Building NO.2100", "pincode": 572200, "city": "Sanya", "province": "Hainan" }, ] }
该方法将所有相关数据保存在单个文档中,这使得检索和维护更容易。可以使用单个查询来在整个文档检索,例如 -
> db.users.findOne({"name":"Maxsu"},{"address":1, "name":1})
请注意,在上述查询中,
db
和users
分别是数据库和集合。缺点是如果嵌入式文档的大小如果不断增长,可能会影响读/写性能。
5.2建模参考关系
这是设计规范化关系的方法。 在这种方法中,用户和地址文件将分别维护,但用户文档将包含一个将引用地址文档的
id
字段的字段。{ "_id":ObjectId("52ffc33321332111sdfaf"), "contact": "13800138000", "dob": "1991-11-11", "name": "Maxsu", "address_ids": [ ObjectId("123123"), ObjectId("123412") ] }
如上所示,用户文档包含对应地址的
ObjectId
的数组字段address_ids
。 使用这些ObjectIds,我们可以从那里查询地址文件并获取地址详细信息。 使用这种方法,需要两个查询:首先从用户文档获取address_ids
字段,然后从地址集中获取这些地址。>var result = db.users.findOne({"name":"Maxsu"},{"address_ids":1}) >var addresses = db.address.find({"_id":{"$in":result["address_ids"]}})
6.MongoDB-update多层嵌套数组解决办法
{ "_id" : 1 "user_id": 1, "message" : "Yes" "translations" : [ { "destination" : "fr", "text": "Oui" }, { "destination" : "bf", "text": "uid" }, ] }
如果是一层数组,可以用如下语句更新数组里指定key的value
db.getCollection('message').update({ '_id': 1, 'translations.destination': 'fr' }, { '$set': { "translations.$.text": "asd" } }
如果再加一层嵌套
{ "_id" : 1 "user_id": 1, "message" : "Yes" "translations" : [ { "destination" : "fr", "text": "Oui", "rating" : [ { "user_id" : 1, "rating" : 1 }, { "user_id" : 2, "rating" : 1 } ] } ] }
使用这个更新语句就会报错了
db.getCollection('message').update({ '_id': 1, 'translations.destination': 'fr', 'translations.rating.user_id':'1' }, { '$set': { "translations.$.rating.$.rating": 5 } }
目前mongodb不支持多个$占位符,推荐的方法的修改数据结构,把数据格式改成这样,把数组元素改成key-value形式
{ "_id" : 1 "user_id": 1, "message" : "Yes" "translations" : { "fr": { "destination" : "fr", "text": "Oui", "rating" : [ { "user_id" : 1, "rating" : 1 }, { "user_id" : 2, "rating" : 1 } } }, "en": {...} ] }
执行如下更新语句
db.getCollection('message').update({ '_id': 1, 'translations.destination': 'fr', 'translations.rating.user_id':'1' }, { '$set': { translations.fr.rating.$.rating”: 5 } }
ps:只能使用一个$占位符的问题在社区里已经提了很久了,一直没有得到解决,希望下个版本可以解决。
四、Python和MongoDB的交互
第一步:安装第三方模块pip3 install pymongo
代码演示:
import pymongo from pymongo import MongoClient from bson.objectid import ObjectId #1.使用MongoClient建立连接 #方式一:使用默认的主机和端口 client1 = MongoClient() #方式二:明确指定主机和端口号 #client2 = MongoClient("localhost",27017) #client2 = MongoClient(host="localhost",port=27017) #方式三:使用url的方式 #client3 = MongoClient("mongodb://localhost:27017/") #2.获取数据库 db = client1.test #db = client1['test'] #database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test') print(db) #4.获取集合 col1 = db.myCollection #col2 = db['myCollection'] #5.插入文档 #文档 item1 = { 'id':1001, 'name':'jack', 'age':30, 'gender':'female' } #插入单条文档 #result1 = col1.insert(item1) #print(result1) #5c2340329fc1753893fb7c3b item2 = { 'id':1002, 'name':'tom', 'age':40, 'gender':'male' } item3 = { 'id':1003, 'name':'bob', 'age':15, 'gender':'male' } #插入多条文档 #result2 = col1.insert([item2,item3]) #print(result2) #6.查询文档 #返回结果为一个字典,参数也是一个字典,表示查询的条件 r0 = col1.find_one({'name':'bob'}) print(r0) r0 = col1.find_one({'_id':ObjectId('5c2340f49fc1753968c8fd99')}) #导入ObjectId print(r0) r1 = col1.find({'age':40}) print(r1) #返回的结果为Cursor,是一个生成器,需要遍历,其中的元素是字典 for r in r1: print(r) r2 = col1.find({'age':{'$gt':20}}) #7.其他的函数 #7.1统计条数 c1 = col1.find().count() print(c1) c2 = col1.find({'age':{'$gt':20}}).count() #排序 s1 = col1.find().sort('name',pymongo.ASCENDING) #限制:limit #偏移、跳过:skip s1 = col1.find().sort('name',pymongo.ASCENDING).skip(2) s1 = col1.find().sort('name',pymongo.ASCENDING).skip(2).limit(3) #8.更新文档 conditon = {'name':'bob'} re0 = col1.find_one(conditon) #字典 re0['age'] = 60 #update()将所有符合条件的全部更新,类似于update_many(),update_one()表示只更新第一条匹配到的数据 re1 = col1.update(conditon,re0) print(re1) #9.删除文档 r1 = col1.remove({'name':'bob'}) r1 = col1.delete_one({'name':'bob'}) r1 = col1.delete_many({'name':'bob'})