多路查找树

饺子泡牛奶

于 2023-04-01 10:19:10 发布

阅读量294

点赞数

分类专栏：数据结构与算法文章标签： b树数据结构

本文链接：https://blog.csdn.net/weixin_48776531/article/details/129893487

版权

22 篇文章 1 订阅

订阅专栏

二叉树的操作效率较高，但是也存在问题。

在这里插入图片描述

多叉树通过重新组织节点，减少树的高度，能对二叉树进行优化。

在二叉树中，每个节点有数据项，最多有两个子节点。如果允许每个节点可以有更多的数据项和更多的子节点，就是多叉树（Multiway tree）。
举例说明：2-3树，2-3-4树 就是多叉树。
示意图：

在这里插入图片描述

B树 通过重新组织节点，降低树的高度，并且减少 I/O 读写次数来提升效率。

在这里插入图片描述

文件系统及数据库系统的设计者利用了磁盘预读原理，将一个节点的大小设为等于一个页（页得大小通常为 4k），这样每个节点只需要一次 I/O 就可以完全载入。
假设将树的度 M 设置为 1024，在 600 亿个元素中最多只需要 4 次 I/O 操作就可以读取到想要的元素，B树（B+树）广泛应用于文件存储系统以及数据库系统中。

2-3树 是由二节点和三节点构成的树，同时它也是最简单的 B树 结构。

需求：将数列{16, 24, 12, 32, 14, 26, 34, 10, 8, 28, 38, 20} 构建成 2-3树，并保证数据插入的大小顺序。

前提条件：
- 2-3树 的所有叶子节点都在同一层（只要是 B树 都满足这个条件）；
- 有两个子节点的节点叫二节点，二节点要么没有子节点，要么有两个子节点；
- 有三个子节点的节点叫三节点，三节点要么没有子节点，要么有三个子节点；
插入规则：当按照规则插入一个数到某个节点时，不能满足上面三个要求，就需要拆，先向上拆，如果上层满，则拆本层，拆后仍然需要满足上面 3 个条件；
备注提示：对于三节点的子树的值大小仍然遵守（BST 二叉排序树）的规则。
数列拆解过程-示意图：

在这里插入图片描述

在这里插入图片描述

B(Balanced)-Tree 树即 B树（也有翻译为 B- 树）。

在这里插入图片描述

说明：
- 阶：节点的最多子节点个数。比如 2-3树 的阶是 3，2-3-4树 的阶是 4。
- 搜索：从根节点开始，对节点内的关键字（有序）序列进行二分查找，如果命中则结束，否则进入查询关键字所属范围的儿子节点；重复，直到所对应的儿子指针为空或已经是叶子节点。
- 关键字分布：集合分布在整颗树中（即叶子节点和非叶子节点都存放数据），搜索有可能在非叶子节点结束。
- 搜索性能：等价于在关键字全集内做一次二分查找。

B+树 是 B树 的变体，也是一种多路搜索树。

在这里插入图片描述

说明：
- 搜索：B+树 的搜索与 B树 也基本相同，区别是 B+树 只有达到叶子节点才命中（ B树 可以在非叶子节点命中）。
- 关键字分布：所有关键字都出现在叶子节点的链表中（即数据只能在叶子节点<也叫稠密索引>），且链表中的关键字（数据）恰好是有序的，搜索不可能在非叶子节点命中。
- 非叶子节点相当于是叶子节点的索引（稀疏索引），叶子节点相当于是存储（关键字）数据的数据层。
- 场景：更适合文件索引系统。
- 搜索性能：也等价于在关键字全集做一次二分查找。
额外补充：MySQL 建索引可使用的数据结构有 B+树 和 Hash 两种，但是 Hash 用得很少，优点是可以快速定位到某一行，缺点是不能解决范围查询问题。对于如果不需要使用范围查询、只需要精准查询的场景，可以使用 Hash 索引方法，比如查电话号码，但绝大多数情况下使用的是 B+树。
注意：B树 和 B+树 各有自己的应用场景，不能说 B+树 完全比 B树 好，反之亦然。