1. 二叉树与B树
1.1 二叉树存在的问题
二叉树的节点很多,会存在以下问题
- 在构建二叉树时,需要多次进行IO操作,速度慢
- 节点海量,也会造成二叉树的高度很大,降低操作速度
1.2 多叉树
- 允许每个节点可以有更多的数据项和更多的子节点,就是多叉树(multiway tree)
- 2-3树,2-3-4树都是多叉树,多叉树通过重新组织节点,减少树的高度,能对二叉树进行优化
1.3 B树的基本介绍
- 2-3
- B树通过重新组织节点,降低树的高度,并且减少IO读写次数来提升效率
- 文件系统及数据库系统的设计者利用了磁盘预读原理,将一个节点的大小设为等于一个页(大小通常为4k),这样每个节点只需要一次IO就可以完全载入
- 将树的度M设置为1024,在600亿个元素中最多只需要4次IO操作就可以读取想要的元素,B树广泛应用于文件存储系统数据库系统中
1.4 2-3树
- 2-3树是最简单的B树结构
- 2-3树的所有叶子节点都在同一层(只要是B树必须满足)
- 有两个子节点的节点叫二节点,二节点要么没有子节点,要么两个子节点
- 有三个子节点的节点叫三节点,三节点要么没有子节点,要么三个子节点
- 2-3树是由二节点和三节点构成的树
1.5 B树
-B-tree树即B树,B是Balanced
B树的阶:节点的最多子节点个数,比如2-3树的阶是3,2-3-4树的阶是4
搜索性能等价于在关键字全集内做一次二分查找
1.6 B+树
- B+树是B树的变体,也是一种多路搜索树
- 所有关键字都出现在叶子节点的链表中,且链表中的关键字恰好是有序的
- 更适合文件索引系统
1.7 B*树
- B*树是B+树的变体,在B+树的非根和非叶子节点再增加指向兄弟的指针
- B*树定义了非叶子节点关键字个数至少为(2/3)*M,即块的最低使用率为2/3,B+树的块最低使用率为B+树的1/2
- B*树分配新节点的概率比B+树低,空间使用率更高