浅析日志结构的存储引擎(1)-bitcask
浅析日志结构的存储引擎(2)-SSTable和LSM-Tree
前面两篇文章介绍了比较好理解的日志结构引擎LSM-Tree,但它们不是最常见的索引类型。目前最广泛使用的索引结构是B-tree。B-tree维护着按key排序的key-value对,这样可以实现高效的key-value查找和区间查询。
一、B-tree的存储
前面的文章提到,日志结构存储引擎将数据库分解为可变大小的段,并且始终按顺序写入段(追加写)。而B-tree将数据库分解成固定大小的块和页,通常是PAGESIZE大小4KB(也可能更大),页是读/写的最小单元,这种设计也符合磁盘的读取规则。
以mysql为例,我们都知道InnoDB的存储数据格式是按主键排序的(MyISAM和InnoDB的区别),数据都存储在最底层叶子节点。某一页被指定为B-Tree的根,如下图:
假设我们需要查找key=251,需要沿着200-300的区间,最后找到一个包含单个key=251的父