MongoDB
概念解析
- database:数据库
- collection:数据库表/集合
- document:数据记录行/文档
- field:数据字段/域
- index:索引
- primary key:主键
数据库
show dbs
显示所有数据的列表。db
显示当前数据库对象或集合。use
连接指定数据库。
文档
- 文档的键/值对是有序的。
- 文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。
- MongoDB 区分类型和大小写。
- MongoDB 的文档不能有重复的键。
- 文档的键是字符串。除了少数例外情况,键可以使用任意 UTF-8 字符。
文档键命名规范
- 键不能含有\0 (空字符)。这个字符用来表示键的结尾。
- $ 有特别的意义,只有在特定环境下才能使用。
- 以下划线 “_” 开头的键是保留的(不是严格要求的)。
集合
- 集合名不能是空字符串 “”。
- 集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。
- 集合名不能以"system."开头,这是为系统集合保留的前缀。
- 用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现 $。
数据类型
- String:字符串
- Integer:整型数值
- Boolean:布尔值
- Double:双精度浮点值
- Min/Max keys:将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。
- Array:用于将数组或列表或多个值存储为一个键。
- Timestamp:时间戳。记录文档修改或添加的具体时间。
- Object:用于内嵌文档。
- Null:用于创建空值。
- Date:日期时间。用 UNIX 时间格式来存储当前日期或时间。
- Object ID:对象 ID。用于创建文档的 ID。
- Code:代码类型。用于在文档中存储 JavaScript 代码。
主要数据类型
- ObjectId:类似唯一主键,可以很快的去生成和排序,包含 12 bytes。
- 前 4 个字节表示创建 unix 时间戳,格林尼治时间 UTC 时间,比北京时间晚了 8 个小时。
- 接下来的 3 个字节是机器标识码。
- 紧接的两个字节由进程 id 组成 PID。
- 最后三个字节是随机数。
- 字符串
- BSON 字符串都是 UTF-8 编码。
- 日期
- 表示当前距离 Unix 新纪元(1970 年 1 月 1 日)的毫秒数。
MongoDB 连接
- mongo
MongoDB 数据库操作
创建数据库
use DATABASE_NAME
:如果数据库不存在,则创建数据库,否则切换到指定数据库。- MongoDB 中默认的数据库为 test,如果你没有创建新的数据库,集合将存放在 test 数据库中。
删除数据库
db.dropDatabase()
删除当前数据库,默认为 test,你可以使用 db 命令查看当前数据库名。
创建集合
db.createCollection(name, options)
,db.createCollection("test_col")
。- name: 要创建的集合名称。
- options: 可选参数, 指定有关内存大小及索引的选项。
- 在 MongoDB 中,你不需要创建集合。当你插入一些文档时,MongoDB 会自动创建集合。
db.col.insert({"name" : "Tom"})
。 db.createView()
。
删除集合
db.collection.drop()
,db.test_col.drop()
。
插入文档
- 向集合中插入文档,语法如下:
db.collection.insertMany()
或db.collection.insertOne()
,db.collection.insert()
。
db.col.insert({title: 'MongoDB 教程',
description: 'MongoDB 是一个 Nosql 数据库',
tags: ['mongodb', 'database', 'NoSQL'],
likes: 100
})
更新文档
- update(), save(),
db.collection.updateOne()
,db.collection.updateMany()
,db.collection.replaceOne()
。实例:db.col.update({'title':'MongoDB 教程'}, {$set: {'title':'MongoDB'}})
删除文档
db.collection.deleteOne()
,db.collection.deleteMany()
,db.collection.remove()
。实例:db.col.remove({'title':'MongoDB 教程'})
查询文档
- find()
db.collection.find({})
,db.collection.findOne({})
。 - 若要对结果进行格式化,请将 .pretty() 追加到操作中:
db.inventory.find({}).pretty()
。
db.collection.bulkWrite()
方法提供批量插入、更新和删除操作的能力。
条件操作符
- MongoDB 中条件操作符有:
- (>) 大于 -
$gt
:db.col.find({likes : {$gt : 100}})
。 - (<) 小于 -
$lt
:db.col.find({likes : {$lt : 150}})
。 - (>=) 大于等于 -
$gte
:db.col.find({likes : {$gte : 100}})
。 - (<= ) 小于等于 -
$lte
:db.col.find({likes : {$lte : 150}})
。
- (>) 大于 -
$type
操作符
- $type 操作符是基于 BSON 类型来检索集合中匹配的数据类型,并返回结果。
db.col.find({"title" : {$type : 2}})
或db.col.find({"title" : {$type : 'string'}})
,获取 “col” 集合中 title 为 String 的数据。
Limit 与 Skip 方法
- limit() 方法接受一个数字参数,该参数指定从 MongoDB 中读取的记录条数。
- 显示查询文档中的两条记录:
db.col.find({},{"title":1,_id:0}).limit(2)
。 - 使用 skip() 方法来跳过指定数量的数据,skip 方法同样接受一个数字参数作为跳过的记录条数。
db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)
。- 只显示第二条文档数据:
db.col.find({},{"title":1,_id:0}).limit(1).skip(1)
。
排序
- sort():
db.COLLECTION_NAME.find().sort({KEY:1})
- skip(), limilt(), sort() 三个放在一起执行的时候,执行的顺序是先 sort(), 然后是 skip(),最后是显示的 limit()。
- 实例演示了 col 集合中的数据按字段 likes 的降序排列:
db.col.find({},{"title":1,_id:0}).sort({"likes":-1})
。
索引
- createIndex() 方法,
db.collection.createIndex(keys, options)
,db.col.createIndex({"title":1})
。Key 值为你要创建的索引字段,1 为指定按升序创建索引,如果你想按降序来创建索引指定为 -1 即可。 - 查看集合索引
db.col.getIndexes()
。 - 删除集合所有索引
db.col.dropIndexes()
。 - 删除集合指定索引
db.col.dropIndex("索引名称")
。
聚合
- aggregate() 方法
db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
- 聚合表达式:
sum
:计算总和。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
。$avg
:计算平均值。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
。$min
:获取集合中所有文档对应值得最小值。$max
:获取集合中所有文档对应值得最大值。$push
:在结果文档中插入值到一个数组中。$addToSet
:在结果文档中插入值到一个数组中,但不创建副本。$first
:根据资源文档的排序获取第一个文档数据。$last
:根据资源文档的排序获取最后一个文档数据。
- 管道,聚合操作:
$project
:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。$match
:用于过滤数据,只输出符合条件的文档。$match
使用 MongoDB 的标准查询操作。$limit
:用来限制 MongoDB 聚合管道返回的文档数。$skip
:在聚合管道中跳过指定数量的文档,并返回余下的文档。$unwind
:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。$group
:将集合中的文档分组,可用于统计结果。$sort
:将输入文档排序后输出。$geoNear
:输出接近某一地理位置的有序文档。
复制(副本集)
- 将数据同步在多个服务器的过程。
- 保障数据的安全性,数据高可用性 (24*7),灾难恢复,无需停机维护(如备份,重建索引,压缩),分布式读取数据。
分片
- 一种集群,满足 MongoDB 数据量大量增长的需求。
- 复制所有的写入操作到主节点,延迟的敏感数据会在主节点查询,单个副本集限制在12个节点,当请求量巨大时会出现内存足,本地磁盘不足,垂直扩展价格昂贵。
备份与恢复
- 在 Mongodb 中我们使用 mongodump 命令来备份 MongoDB 数据。
mongodump -h dbhost -d dbname -o dbdirectory
。 - mongodb 使用 mongorestore 命令来恢复备份的数据。
mongorestore -h <hostname><:port> -d dbname <path>
。
监控
- mongostat 是 mongodb 自带的状态检测工具,在命令行下使用。
- mongotop 也是 mongodb 下的一个内置工具,mongotop 提供了一个方法,用来跟踪一个 MongoDB 的实例,查看哪些大量的时间花费在读取和写入数据。
MongoDB 高级教程
参考
[1] MongoDB 中文手册:https://docs.mongoing.com
[2] 官方文档:https://docs.mongodb.com/manual
[3] MongoDB 菜鸟教程. https://www.runoob.com/mongodb/mongodb-tutorial.html