2-3-4树
向上裂变
元素始终保持排序顺序,整体上保持二叉查找树的特性,即父节点大于左子节点,小于右子节点;
而且节点有多个元素时,每个元素必须大于它左边和它的左子树中的元素。
2-3-4树的查询操作像普通的二叉搜索树一样,非常简单,但由于其节点元素数不确定,在一些变成语言实现起来并不方便,实现一般使用它的等同–红黑树
(一) 对红黑树的基本定义理解
红黑树属于平衡二叉树。红黑树的英文是“Red-Black Tree”,简称 R-B Tree
它是一种不严格的平衡二叉查找树,
红黑树中的节点,一类被标记为黑色,一类被标记为红色。
- 根节点是黑色的;
- 每个叶子节点都是黑色的空节点(NIL),也就是说,叶子节点不存储数据(图中将黑色的、空的叶子节点都省略掉了);
- 任何相邻的节点都不能同时为红色,也就是说,红色节点是被黑色节点隔开的;
- 每个节点,从该节点到达其可达叶子节点的所有路径,都包含相同数目的黑色节点;
(二)对红黑树是“近似平衡”的理解
平衡二叉查找树的初衷,是为了解决二叉查找树因为动态更新导致的性能退化问题。所以,“平衡”的意思可以等价为性能不退化。“近似平衡”就等价为性能不会退化的太严重。
一棵极其平衡的二叉树(满二叉树或完全二叉树)的高度大约是 log2n,所以如果要证明红黑树是近似平衡的,只需要分析,红黑树的高度是否比较稳定地趋近 log2n 就好了。
从四叉树中取出某些节点,放到叶节点位置,四叉树就变成了完全二叉树。所以,仅包含黑色节点的四叉树的高度,比包含相同节点个数的完全二叉树的高度还要小。
2.把红色节点加回去,分析高度变化
所以,红黑树的高度只比高度平衡的 AVL 树的高度(log2n)仅仅大了一倍,在性能上,下降得并不多。这样推导出来的结果不够精确,实际上红黑树的性能更好。
(三)红黑树与AVL树的比较:
- AVL树的时间复杂度虽然优于红黑树,但是对于现在的计算机,cpu太快,可以忽略性能差异
- 红黑树的插入删除比AVL树更便于控制操作
- 红黑树整体性能略优于AVL树(红黑树旋转情况少于AVL树)
它不严格是因为它不是严格控制左、右子树高度或节点数之差小于等于1,但红黑树高度依然是平均log(n),且最坏情况高度不会超过2log(n)。
- 根节点是黑色的,叶子节点是不存储数据的黑色空节点
- 任何两个相邻的节点不能同时为红色
- 任何节点到其可到达的叶节点间包含相同数量的黑色节点
一颗有n个节点的红黑树的高度,高度最多是2(log(n+1))
二叉查找树(BST)具备什么特性呢?
- 左子树上所有节点的值均小于或等于他的根节点的值。,
- 右子树上所有节点的值均大于或等于它的根节点的值。
- 左、右子树也分别为二叉排序树。
这种方式正是二分查找的思想,查找所需的最大次数等同于二叉查找树的高度。
红黑树是一种自平衡的二叉查找树。除了符合二叉查找树的基本特性外,它还具有下列的附加特性:
- 节点是红色或黑色
- 根节点是黑色
- 每个叶子结点都是黑色的空节点(NULL节点)
- 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
- 从任意节点到其每个叶子的所有路径都包含同样数目的黑色节点。