MongoDB作为领先的NoSQL,为了支撑更多的需求场景,也在不断完善其功能。从早期支持大吞吐量读/写操作的MMAPv1存储引擎,到引入支持高并发操作的WiredTiger存储引擎,以及对事务功能的持续演进,MongoDB不仅保留了最初的架构优势,同时又汲取了其他数据库的优点。
MongoDB从 3.0版本引入WiredTiger存储引擎之后开始支持事务,MongoDB 3.6之前的版本只能支持单文档的事务,从MongoDB 4.0版本开始支持复制集部署模式下的事务,从MongoDB 4.2版本开始支持分片集群中的事务。
本文就主要对MongoDB事务的基本原理、事务的snapshot隔离、实现事务间并发操作的MVCC并发控制机制,以及事务日志做一些介绍!
事务的基本原理
与关系型数据库一样,MongoDB事务同样具有ACID特性,说明如下:
-
原子性(Automicity):一个事务要么完全执行成功,要么不做任何改变。
-
一致性(Consistency):当多个事务并行执行时,元素的属性在每个事务中保持一致。
-
隔离性(Isolation):当多个事务同时执行时,互不影响。WiredTiger本身支持多种不同类型的隔离级别,如读-未提交(read-uncommitted)、读-已提交(read-committed)和快照(snapshot)隔离。MongoDB默认选择的是快照隔离。
-
持久性(Durability):一旦提交事务,数据的更改就不会丢失。
在不同隔离级别下,一个事务的生命周期内,可能出现脏读、不可重复读、幻读等现象。
下面介绍这3种现象出现的场景与含义。
1. 脏读现象
例如,某款手机在数据库中的库存还有1部,客户A发起一个查询手机库存的事务,同时,客户B发起了一个购买手机的事务(但未提交事务),此时客户A读到手机库存为0部,认为售完了。但客户B突然不想购买这款手机了,于是回滚了此事务,手机库存又变为1部,客户A读到的手机库存为0部就是一个脏读数据,如下图所示。
2. 不可重复读现象
例如,某款手机在数据库中的库存还有1部,客户A发起