数据库之索引基础

悠然予夏

已于 2022-05-29 20:02:16 修改

阅读量348

点赞数

分类专栏：面试知识清单 MySQL 文章标签： b树数据结构 mysql

于 2022-05-29 13:10:16 首次发布

本文链接：https://blog.csdn.net/weixin_52851967/article/details/125029562

版权

37 篇文章 3 订阅

订阅专栏

30 篇文章 0 订阅

订阅专栏

哈希索引
- 理想时间复杂度为 O(1)
- 适用场景：适用于等值查询的场景，内存数据的索引
- 典型实现：Redis，MySQL 的 memory 引擎
平衡二叉树索引
- 查询和更新的时间复杂度都是 O(log_2(n))
- 适用场景：适用于等值查询以及范围查询；适合内存数据的索引，但不适合磁盘数据的索引，可以认为树的高度决定了磁盘 I/O 的次数，百万数据树高约为 20
BTree 索引
- BTree 其实就是 n 叉树，分叉多意味着节点中的孩子（key）多，树高自然就降低了
- 分叉数由页大小和行（包括 key 与 value）大小决定
  - 假设页大小为 16k，每行 40 个字节，那么分叉数就为 16k / 40 ≈ 410
  - 而分叉为 410，则百万数据树高约为3，仅 3 次 I/O 就能找到所需数据
- 局部性原理：每次 I/O 按页为单位读取数据，把多个 key 相邻的行放在同一页中（每页就是树上一个节点），能进一步减少 I/O
B+ 树索引
- 在 BTree 的基础上做了改进，索引上只存储 key，这样能进一步增加分叉数，假设 key 占 13 个字节，那么一页数据分叉数可以到 1260，树高可以进一步下降为 2

树高计算公式

log{10}(N) / log{10}(M) 其中 N 为数据行数，M 为分叉数

B+Tree 普通节点只存 key，叶子节点才存储 key 和 value，因此分叉数可以更多
- 不过也请注意，普通节点上的 key 有的会与叶子节点的 key 重复
B+Tree 必须到达叶子节点才能找到 value
B+Tree 叶子节点用链表连接，可以方便范围查询及全表遍历

注：这两张图都是仅画了 key，未画 value

假设阶数（m）为5

若为空树，那么直接创建一个节点，插入 key 即可，此时这个叶子结点也是根结点。例如，插入 5
插入时，若当前结点 key 的个数小于阶数，则插入结束
依次插入 8、10、15，按 key 大小升序
插入 16，这时到达了阶数限制，所以要进行分裂
叶子节点分裂规则：将这个叶子结点分裂成左右两个叶子结点，左叶子结点包含前 m/2 个（2个）记录，右结点包含剩下的记录，将中间的 key 进位到父结点中。注意：中间的 key 仍会保留在叶子节点一份
插入 17
插入 18，这时当前结点的 key 个数到达 5，进行分裂
分裂成两个结点，左结点 2 个记录，右结点 3 个记录，key 16 进位到父结点中
插入 19、20、21、22、6、9
插入 7，当前结点的 key 个数到达 5，需要分裂
分裂后 key 7 进入到父结点中，这时父节点 key 个数也到达 5
非叶子节点分裂规则：左子结点包含前 (m-1)/2 个 key，将中间的 key 进位到父结点中（不保留），右子节点包含剩余的 key

以查询 15 为例

接着上面的操作

关注