(本文大部分内容来自百度百科及MongoDB菜鸟教程)
基本概念
MongoDB是一个基于分布式文件存储的数据库,他是一个介于关系数据库和非关系数据库之间的产品,由C++语言编写,支持的数据结构为类似JSON的BSON格式,支持对数据建立索引。
基本特点
- 面向集合存储
- 支持查询与动态查询
- 支持索引,完全索引,包含内部对象
- 支持复制和故障恢复
- 使用高效的二进制数据存储,包括大型对象(如视频等)
- 自动处理碎片
- 持 Golang,RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言
- 文件存储格式为BSON(一种JSON的扩展)
- 可通过网络访问
名词解析
集合(Collection)
数据被分组存储在数据集中,被称为一个集合(Collection)。集合的概念类似于关系型数据库中的表(table),不同的是他不需要定义任何模式(schema)。
(Tips:在关系型数据库中,schema表示数据的组织和结构,简单来说就是数据库对象及其相互之间的关系,是一组相互关联的数据对象,在物理层中与database是同义的,但要注意的是两者并不等同)
每个集合在数据库中都有一个唯一的标识名,并且可以包含无限数目的文档。
文档
可以将文档看成SQL中的数据记录行(row)。
文档存储在集合中,表现形式为键值对(Key-Value) 的形式。
相同的文档不需要设置相同的字段(SQL中的列),相同的字段不必有相同的数据类型。
键(Key):用于标识唯一文档,为字符串类型。
值(Value):可以是各种复杂的文件类型,我们称这种存储模式为BSON。
模式自由(schema-free)
因为其不需要定义任何模式,所以对于存储在MongoDB中的文件,我们不需要了解他的任何结构定义,你完全可以把不同结构的文件存储在同一个数据库里。
分布式文件系统
指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。一个典型的网络可能包括多个供多用户访问的服务器。
BSON
一种二进制表示形式,能用来表示简单数据结构、关联数组以及MongoDB中的各种数据类型。
含义为Binary JSON(二进制的JSON)。
BSON文档(对象)由一个有序的元素列表构成。每个元素由一个字段名、一个类型和一个值组成。
主要使用场景
- 网站实时数据处理。它非常适合实时的插入、更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。
- 缓存。由于性能很高,它适合作为信息基础设施的缓存层。在系统重启之后,由它搭建的持久化缓存层可以避免下层的数据源过载。
- 高伸缩性的场景。非常适合由数十或数百台服务器组成的数据库,它的路线图中已经包含对MapReduce引擎的内置支持。
不适用的场景
- 要求高度事务性的系统。
- 传统的商业智能应用。
- 复杂的跨文档(表)级联查询。
SQL与MongoDB术语对应
SQL术语/概念 | MongoDB术语/概念 | 解释/说明 |
database | database | 数据库 |
table | collection | 数据库表/集合 |
row | document | 数据记录行/文档 |
column | field | 数据字段/域 |
index | index | 索引 |
table joins | / | 表连接,MongoDB不支持 |
primary key | primary key | 主键,MongoDB自动将_id字段设置为主键 |
需要注意的点
- 文档中的键值对是有序的。
- 区分类型和大小写。
- 文档不能包含相同的键
- 键是字符串类型