数据库索引使用树结构存储,
- B-树就是B树,中间的横线不是减号;
- 树查询效率高且可以保持有序;
- 不用二叉查找树实现因为磁盘IO:索引存在磁盘中,当数据量比较大的时候,索引的大小可能有几个G甚至更多,此时我们只能逐一加载磁盘页,磁盘页对应着索引树的节点。
B树
一个m阶的B树具有如下几个特征:
- 根节点至少有两个子女;
- 每个中间节点都包含k-1个元素和k个孩子,其中 m/2 <= k <= m
- 每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m
- 所有的叶子结点都位于同一层
- 每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划
B+树
一个m阶的B+树具有如下几个特征:
- 有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点;
- 所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接;
- 所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。
B+树相比B-树的优势:
- IO次数更少;
- 查询性能稳定(因为B+必须要找到叶子节点,B树不用);
- 范围查询渐变。