多路查找树总结(2-3树、2-3-4树、B树、B+树、B*树)

闪电蛙

于 2020-08-05 21:14:11 发布

阅读量507

点赞数 2

分类专栏：数据结构与算法文章标签：二叉树 mysql 数据结构

本文链接：https://blog.csdn.net/weixin_42893085/article/details/107824932

版权

数据结构与算法专栏收录该内容

3 篇文章 0 订阅

订阅专栏

二叉树的问题分析：

二叉树的操作效率较高，但存在着很大的问题

在这里插入图片描述
存在的问题：

二叉树需要加载到内存时，如果二叉树的节点少，并不会出现什么问题，但是如果二叉树的节点很多，就会出现很大的问题
问题一：在构建二叉树时，需要多次进行I/O操作(海量数据存在数据库或文件中)，节点海量，构造二叉树时，速度有影响。
问题二：节点海量，也会造成二叉树的高度很大，会降低操作速度

解决问题的方案为：多叉树
1.在二叉树中，每个节点有数据项，最多有两个子节点，如果允许每个节点可以有更多的数据项和更多的子节点，就是多叉树(multiway tree)。

2-3树：

2-3树，2-3-4树都是属于多叉树，多叉树通过重新组织节点，减少树的高度，能对二叉树进行优化！

在这里插入图片描述

2-3树是最简单的B树，特点：

2-3树的所有叶子节点都在同一层(只要是B树都满足这个条件)
有两个子节点的节点叫二节点，二节点要么没有子节点，要么有两个子节点。
有三个子节点的节点叫三节点，三节点要么没有子节点，要么有三个子节点。
2-3树是由二节点和三节点构成的树。

2-3树的插入规则：

2-3树的所有叶子节点都在同一层(只要是B树都满足这个条件)
有两个子节点的节点叫二节点，二节点要么没有子节点，要么有两个子节点。
有三个子节点的节点叫三节点，三节点要么没有子节点，要么有三个子节点。
当按照规则插入一个数到某个节点时，不能满足上面三个要求，就需要拆，先向上拆，如果上层满，则拆本层，拆后仍然需要满足上面3个条件。

2-3-4树：(也是B树的一种)

在这里插入图片描述
但是它与2-3树不同的是，它多了一个度为4的树！

重点：

B树：(B-,B-树,B-tree)–>数据分散在叶子节点和非叶子节点上

B-tree树即B树，B即Balanced，平衡。
Mysql中的索引是基于B+树， Mongodb使用的索引是B树
在这里插入图片描述
B树的说明：
1). B树的阶：节点的最多子节点的个数，比如2-3树的阶是3，2-3-4树的阶是4
2). B-树的搜索，从根节点开始，对节点内的关键字(有序)序列进行二分查找，如果命中则结束，否则进入到查询关键字所属范围的儿子节点重担，直到所对应的儿子指针为空，或已经是叶子结点！
3). 关键字集合分布在整颗树中，即叶子节点和非叶子节点都存放数据。
4). 搜索有可能在非叶子节点结束
5). 其搜索性能等价于在关键字全集内做一次二分查找！

B+树：–>所有的数据都存放在叶子节点上，可以很好的降低树的高度

B+树是B树的变体，也是一种多路搜索树！

B+树的说明：

1). B+树的搜索与B树基本相同，区别是B+树只有达到叶子节点才命中(B树可以在非叶子结果命中)，其性能也等价于在关键字全集做一次二分查找。
2). 所有关键字都出现在叶子节点的链表中(数据只能在叶子节点【也叫稠密索引】,且链表中的关键字(数据)恰好是有序的)。
3). 不可能在非叶子节点命中。
4). 非叶子节点相当于是叶子节点的索引(稀疏索引)，叶子节点相当于是存储(关键字)数据的数据层。
5). 更适合文件索引系统。
6). B树和B+树各有自己的应用场景，不能说B+树完全比B树好，反之亦然