序言
二叉树的缺点
- 二叉树需要加载到内存中,如果节点少,没什么问题,若是节点非常多,就会带来问题
- 当构建二叉树时,需要进行多次I/O操作,构造速度会有影响
- 节点海量,会造成二叉树的高度非常大降低操作速度
多叉树
- 每个节点可以右多个子节点
B树
- 节点的度:此节点拥有子节点的个数称为节点的度
- 数的度:数中所有节点的度的最大值
- B树通过重新组织节点,降低了数的高度
- 文件系统或是数据库系统利用了磁盘预先读取原理,将一个节点的大小设置为一个页(一个页的大小为4K),这样每个节点只需要依次I/O操作就可以完全载入
2-3树
2-3树的简介
- 2-3树所有叶子节点都在同一层(所有的B树都满足)
- 有俩个子节点的节点叫二节点,而节点要么没有子节点,妖媚就有俩个
- 有三个子节点的节点叫三节点,而节点要么没有子节点,妖媚就有三个
- 2-3树是由二节点和三节点构成的树
2-3数的构造(构造时仍要满足有序)
- 2-3树所有叶子节点都在同一层(所有的B树都满足)
- 有俩个子节点的节点叫二节点,而节点要么没有子节点,妖媚就有俩个
- 有三个子节点的节点叫三节点,而节点要么没有子节点,妖媚就有三个
- 2-3树是由二节点和三节点构成的树
- 当按照规则插入一个数到某个节点时,如果不能满足以上三个要求,则就要拆,先向上拆,如果上层满,则拆本层,拆后仍要满足以上三个条件
- 对于三节点的子树的大小仍然要遵循二叉排序树的规则
- 举例
B树介绍
-
B树的阶
节点最多子节点的个数 -
B-树搜索
从根节点开始,对节点内的关键字序列进行二分查找,如果命中则结束,否则进入关键字所属范围的儿子节点,重复,知道所对应的儿子节点为空或是已达到叶子节点 -
关键字集合分布在整棵树种,即叶子节点和非叶子节点都存放数据
-
搜索有可能再非叶子节点结束
-
其搜索性关键字等于再全局范围内做一次二分查找
B+树(也是一种多路查找树)
- B+树搜索与B树基本相同,区别是B+树只有到达叶子节点才命中(B树可以在非叶子节点命中),其性能等价于再关键字全集做一次二分查找
- 所有关键字都出现在叶子节点链表中(即数据只能在叶子节点(也叫稠密索引))且链表的关键字序列时有序的
- 不可能在非叶子节点命中
- 非叶子节点相当于时叶子节点的索引(稀疏索引),叶子节点相当于是存储(关键字)数据的数据层
- 更适合文件索引系统
- B树和B+树各有自己的应用场景,不能说B树完全比B+树好
B*树
- B*树是B+树的变体,在非根和非叶子节点再加上指向兄弟的指针
- B树定义了非叶子节点的关键字的个数至少为(2/3) M个,即快的使用率为2/3,而B+树的快的最低使用率为1/2
- B*树分配新节点的概论比B+数要低,即它的空间使用率更高