MongoDB基本概念
SQL术语/概念 | MongoDB术语/概念 | 解释/说明 |
---|---|---|
database | database | 数据库 |
table | collection | 数据库表/集合 |
row | document | 数据记录行/文档 |
column | field | 数据字段/域 |
index | index | 索引 |
table joins | 表连接,MongoDB不支持 | |
primary key | primary key | 主键,MongoDB自动将_id字段设置为主键 |
MongoDB中的基本概念如上表所示,MongoDB中数据库包含集合,集合包含文档。一个MongoDB服务器实例可以承载多个数据。每个数据库之间完全独立。
数据库
MongoDB中的数据库概念和MySQL基本一致,每个数据库之间彼此隔离,数据库命名应小写。
MongoDB中自带一些数据库,完成一些基本功能:
- admin数据库:从权限的角度来看,这是超级管理员root的数据库,类似于MySQL中的user,在admin数据库中添加的用户会具有数据库管理权限。一些特定的命令也只能在这个数据库运行,如列出所有数据库或者关闭服务器等
- local数据库:这个数据库的数据永远不会被复制,可以用来存储仅限本地单台服务器使用的数据
- config数据库:当MongoDB用于分片时,config数据库在内部使用,用于保存分片信息
集合
MongoDB中集合的概念类似于MySQL中的表的概念,一个集合中可以存储多个文档。
集合最大的特点是无模式的,即一个集合里可以存储不同形式的文档,文档可以有不一样的键名,也可以有不同数量的键,只要满足文档的要求即可,MongoDB会自动识别每个字段的类型
需要注意的是集合的命名不能以system.开头,这是为系统集合保留的前缀
MongoDB中支持子集合,子集合是集合下的另一个集合,习惯使用"."分隔,例如"app.user"和"app.role"两个子集合,分别代表应用的用户信息和角色信息,数据分别存储在两个子集合中,app集合是不存储数据的,只是为了形式上的清晰,app集合甚至可以删除掉。
固定集合(Capped)
MongoDB的固定集合(Capped Collection)是性能出色且有固定大小的集合,当集合达到容量上限时,最早的文档会被删除为新文档腾出空间。
固定集合拥有插入速度极快,按照插入顺序存储,默认输出则是插入顺序的数据,FIFO的淘汰策略,允许更新,不允许删除的特点。
文档
MongoDB是一个面向文档存储的数据库,文档是MongoDB中数据的基本单元。之前介绍过MongoDB数据存储格式为BSON,键值对按照BSON格式组合起来就是一个文档。
文档的特点:
- 每个文档都有一个"_id"的键,是MongoDB默认生成的主键,也可以手动指定,但不能重复
- 文档中的每个键顺序是有序的,即前后顺序不同就不是一个文档
- 文档中的键值对,值不但可以是字符串,还可以是数值,日期等数据类型
- 文档的键值对区分大小写
数据类型
数据类型 | 描述 |
---|---|
String | 字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。 |
Integer | 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。 |
Boolean | 布尔值。用于存储布尔值(真/假)。 |
Double | 双精度浮点值。用于存储浮点值。 |
Min/Max keys | 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。 |
Array | 用于将数组或列表或多个值存储为一个键。 |
Timestamp | 时间戳。记录文档修改或添加的具体时间。 |
Object | 用于内嵌文档。 |
Null | 用于创建空值。 |
Symbol | 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。 |
Date | 日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。 |
Object ID | 对象 ID。用于创建文档的 ID。 |
Binary Data | 二进制数据。用于存储二进制数据。 |
Code | 代码类型。用于在文档中存储 JavaScript 代码。 |
Regular expression | 正则表达式类型。用于存储正则表达式。 |
ObjectId 类似唯一主键,可以很快的去生成和排序,包含 12 bytes,含义是:
- 前 4 个字节表示创建 unix 时间戳,格林尼治时间 UTC 时间,比北京时间晚了 8 个小时
- 接下来的 3 个字节是机器标识码
- 紧接的两个字节由进程 id 组成 PID
- 最后三个字节是随机数