数据结构与算法—树6
声明:以下是学的尚硅谷网课并结合网上资料所记的笔记。可能会有一些错误,发现了会修改。
前言: 二叉树的操作效率高,但是也存在问题。二叉树需要加载到内存的,如果二叉树的节点少,没什么问题但是如果二叉树的节点很多(比如1亿),就存在如下问题:
- 在构建二叉树时,需要进行多次i/o操作(海量数据存在数据库或文件中)。节点海量,构建二叉树时,对速度有影响。
- 节点海量,也会造成二叉树的高度很大,会降低操作速度。
多叉树
- 在二叉树中,每个节点有数据项,最多有两个子节点。如果允许每个节点可以有更多的数据项和更多的子节点,就是多叉树(multiway tree)。
- 后面的2-3树,2-3-4树就是多叉树。多叉树通过重新组织节点,减少树的高度,能对二叉树进行优化。
B树、B+树和B*树
B树
B-tree即B树,B为Balanced,平衡的意思。有人把B-tree翻译成B-树,实际上也是指的B树。B树、B+树和B*树都得满足搜索树或者说排序树的要求。通过重新组织节点,降低树的高度,并且减少i/o读写次数来提升效率。
特点:
- B树通过重新组织节点,降低了树的高度,其中一个节点有多个数据项。
- 文件系统及数据库系统的设计者利用了磁盘预读原理,将一个节点的大小设为等于一个页(页的大小通常为4k),这样每个节点只需要一次i/o就可以完全载入。
- 将 树的度 M设置为1024,在 600亿个元素 中最多只需要 4次i/o操作 就可以读取到想要的元素,B树广泛的应用于文件存储系统以及数据库系统中。 节点度: 指的是节点下面的子节点数量。树的度: 树内的节点度的最大值。
2-3树是最基本的B树结构,具有以下特点:
- 2-3树的所有叶子节点都在同一层。(只要是B树都满足这个条件)
- 有两个子节点的节点叫二节点,二节点要么没有子节点,要么有两个子节点,二节点有一个数据项。
- 有三个子节点的节点叫三节点,三节点要么没有子节点,要么有三个子节点,三节点有两个数据项。
- 2-3树是由二节点和三节点构成的树。
- 保证数据插入的大小顺序。
例: 将数列{16,24,12,32,14,26,34,10,8,28,38,20}按照上述特点构建成2-3树,并保证数据插入的大小顺序(满足二叉排序树规则),如下图所示。
2-3-4树概念和2-3树类似,也是一种B树。 如下图所示为一颗2-3-4树。
在学习Mysql时,经常听说某种类型的索引是基于B树或者B+树的,如图为一颗B树:
B+树
B+树是B树的变体,也是一种多路搜索树。如图:
B*树
B*树是B+树的变体,在B+树的非根和非叶子节点再增加指向兄弟的指针。如图:
--------------------------------------- 个人学习笔记----------------------------------------