【Mongo】存储引擎-WiredTiger概览

最新推荐文章于 2024-08-09 10:43:48 发布

全是泡沫

最新推荐文章于 2024-08-09 10:43:48 发布

阅读量1.4k

点赞数

分类专栏：数据库 NoSQL MongoDB 文章标签：存储引擎 Mongo

本文链接：https://blog.csdn.net/qq_31665011/article/details/75040506

版权

6 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

WiredTiger的写操作会先写入Cache，并持久化到WAL(Write ahead log)，每60s或log文件达到2GB时会做一次Checkpoint，将当前的数据持久化，产生一个新的快照。

session 模块，负责和wt引擎上层交互的句柄，每个session会关联多个cursor，cursor属于一个session
cache 模块，主要有内存中的btree page(数据页，索引页，溢出页)构成
evict 模块，如果cache内存紧张，触发cache淘汰，便利btree，并根据LRU排序淘汰
Journal 模块，WAL log，类似InnoDB的redolog，保证数据持久化，通过定时和定量阈值来flush
checkpoint 模块，类似InnoDB checkpoint机制，异步执行btree刷盘，checkpoint之后通知log模块更新log_ckpt_lsn(lsn概念和InnoDB一致)
block manager模块，负责磁盘IO的读写，cache、evict、checkpoint模块均通过该模块访问磁盘

Wiredtiger的Cache采用Btree的方式组织，每个Btree节点为一个page，root page是btree的根节点，internal page是btree的中间索引节点，leaf page是真正存储数据的叶子节点；

btree的数据以page为单位按需从磁盘加载或写入磁盘

持久化时，修改操作不会在原来的leaf page上进行，而是写入新分配的page，每次checkpoint都会产生一个新的root page。这样的好处是对不修改原有page，就能更好的并发。

每个客户端的写请求会先通过Journal进行持久化，提供参数 {j: true} ；
每60s或（Journal）log文件达到2GB时会做一次Checkpoint，将当前的数据持久化，产生一个新的快照；
Checkpoint时会遍历所有btree，把btree的所有leaf_page做reconcile操作，然后重新分配root_page； reconcile 操作：把内存里page的修改(保存在page的modify_list中)变成磁盘page的结构写入
在一个新的Checkpoint过程中，先前的Checkpoint仍然有效，即使在CheckPoint过程中出现故障，通过重启也能回复到上一次有效的Checkpoint。（加上Journal的log可进行完整数据回复）
当一个新Checkpoint可用的时候，释放掉旧的Checkpoint。（同时Journal更新checkpoint offset，即可丢弃之前的journal）

所以写请求写入journal后就可以保证Durability