MySQL B+树 BTree原理、增删改(详细)

一、为什么MySQL采用B+树

哈希索引

        理想时间复杂度为 O(1)

        适用场景:适用于等值查询的场景,内存数据的索引

        典型实现:Redis,MySQL memory 引擎

平衡二叉树索引

        查询和更新的时间复杂度都是 O(log(n))

        适用场景:内存数据的索引,但不适合磁盘数据的索引,可以认为树的高度决定了磁盘 I/O 的次数,百万数据树高约为 20(lg(1000000)/ lg(2))

BTree 索引

        BTree 其实就是 n 叉树,分叉多意味着节点中的孩子(key)多,树高自然就降低了

        分叉数由页大小和行(包括 key 与 value)大小决定

                假设页大小为 16k,每行 40 个字节,那么分叉数就为 16k / 40 410

                而分叉为 410,则百万数据树高约为3,仅 3 次 I/O 就能找到所需数据

        局部性原理每次 I/O 按页为单位读取数据,把多个 key 相邻的行放在同一页中(每页就是树上一个节点),能进一步减少 I/O

B+ 树索引

        在 BTree 的基础上做了改进,索引上只存储 key,这样能进一步增加分叉数,假设 key 13 个字节,那么一页数据分叉数可以到 1260,树高可以进一步下降为 2

二、BTree vs B+Tree

1、BTree key value 在每个节点上,无论叶子还是非叶子节点,而 B+Tree 普通节点只存 key,叶子节点才存储 key value

2、B+Tree 叶子节点用链表连接,可以方便范围查询及全表遍历

3、无论 BTree 还是 B+Tree,每个叶子节点到根节点距离都相同,B+Tree 必须到达叶子节点才能找到 value

注:这两张图都是仅画了 key,未画 value

二、B+Tree 新增key(以 5 阶为例)

插入 1920212269 

插入 7,当前结点的 key 个数到达 5,需要分裂

 分裂后 key 7 进入到父结点中,这时父节点 key 个数也到达 5

非叶子节点分裂规则:左子结点包含前 (m-1)/2 key,将中间的 key 进位到父结点中(不保留),右子节点包含剩余的 key

三、B+Tree 查询key

以查询 15 为例

第一次 I/O

 第二次 I/O

第三次 I/O

四、B+Tree 删除key

叶子节点key 删除,初始状态

 删完有富余。即删除后结点的key的个数 > m/2 – 1,删除操作结束,例如删除 22

 删完没富余,但兄弟节点有富余。即兄弟结点 key 有富余( > m/2 – 1 ),向兄弟结点借一个记录,同时替换父节点,例如删除 15

兄弟节点也不富余,合并兄弟叶子节点。即兄弟节点合并成一个新的叶子结点,并删除父结点中的key,将当前结点指向父结点,例如删除 7

 也需要删除非叶子节点中的 7,并替换父节点保证区间仍有效

 左右兄弟都不够借,合并

 回顾删除要点:

1. 非叶子节点 key 的个数 > m/2 – 1,则删除操作结束,否则执行 2

2. 若兄弟结点有富余,父结点 key 下移,兄弟结点 key 上移,删除结束,否则执行 3

3. 兄第节点没富余,当前结点和兄弟结点及父结点合并成一个新的结点。重复 1

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

悠哉iky

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值