摘要
红黑树是数据结构中重要的一种结构,其本质是通过定义一些性质,让二叉树分布结构变的相对合理,并在动态添加或者删除的过程中去修复结构。红黑树在搜索、添加、删除这 3 种操作的效率相对比较均衡,所以有很多实际的应用场景。
红黑树是一种自平衡的二叉搜索树,是一种重要的数据结构,后面的集合、映射等数据结构,都可以从这基础上去搭建。同时也是内容和逻辑比较多的数据结构,需要多花费一些精力去学习它。
红黑树有 5 条性质,凡是满足这 5 条,才能称为红黑树,这 5 条性质有:
- 节点必须是 RED 或者 BLACK,也可以理解为存在一个 Boolean 的标志,不是 false 就是 ture。
- 根节点是 BLACK。
- 叶子节点都是 BLACK,这里要特别留意,叶子节点存在两个空节点,只有一个子树的节点,另外一个不存在的子树也是一个空节点。
- RED 节点的子节点都是 BLACK,RED 节点的父节点也都是 BLACK。保证**从根节点到叶子节点的所有路径上,不会出现 2 个连续的 RED 节点。
- 从任意一个节点到叶子节点的所有路径上包含的 BLACK 节点数量相同。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eLaOobUI-1640349225584)(https://cdn.jsdelivr.net/gh/shPisces/writing_pic/img/RBT-image1.png)]
注意:如上图的红黑树,必须是要有 null(空节点)节点。后面的示例图中省略,节省作图时间,但一定要有。
为什么满足这 5 条性质,就能保证平衡呢?
先来温习一个平衡的标准,参照 AVL 树中的定义,节点的左右子树的高度差要不大于 1,即是平衡的。
红黑树在满足上面的 5 条性质之后,第 5 条性质中说明 BLACK 节点数量相关也就可以推断出节点的左右子树高度差是不大于 1 的(考虑到空节点,所以有可能是 1)。
红黑树与 4 阶 B 树
看红黑树中,黑色节点和它的左右子节点合并就变成 4 阶 B 树。红黑树的黑色节点和 4 阶 B 树的节点数量也是一样多的。一般情况都是这样,还有其他的特殊情况。如下图:
辅助准备
在开始红黑树之前,先定义一些属性和函数,帮助实现红黑树的代码。
先要给节点(下面统称 node)添加一些判断与其他 node 的关系函数。
-
parent
:父节点,在node
的结构中已经定义父节点的属性 -
sibling
:兄弟节点,若node
是parent
的left
,兄弟节点就是parent
的right
public Node<E> sibling() { if (isLeftChild()) { return parent.right; } if (isRightChild()) { return parent.left; } return null; }
-
uncle
:叔父节点,就是parent
的兄弟节点。 -
grand
:祖父节点,就是parent
的父节点
写下来,先实现一些处理红黑树节点的函数(比如看节点的颜色等)。在这之前,需要提前全局定义两个值,用 Boolean
值来定义RED 和 BLACK。
private static final boolean RED = false;
private static final boolean BLACK = true;
-
染色,把
node
上色:private Node<E> color(Node<E> node, boolean color) { if (node == null) return node; ((RBNode<E>)node).color = color; return node; }
-
染成红色:
private Node<E> red(Node<E> node) { return color(node, RED); }
-
染成黑色:
private Node<E> black(Node<E> node) { return color(node, BLACK); }
-
获取
node
的颜色:private boolean colorOf(Node<E> node) { return node == null ? BLACK : ((RBNode<E>)node).color; }
-
是否是红色:
private boolean isRed(Node<E> node) { return colorOf(node) == RED; }
-
是否是黑色:
private boolean isBlack(Node<E> node) { return colorOf(node) == BLACK; }
添加和删除
红黑树的添加和删除和 AVL 树的添加和删除的原则大致一样,即添加元素都是添加称为叶子节点,删除元素的时候就要区分删除的是叶子节点还是非叶子节点。
在添加或者删除元素之后,要判断当前树是否依然符合红黑树的 5 条性质,若不符合就要做恢复为红黑树的操作。这就是红黑树的重点,内容很多,后面文章专门分析添加和删除处理。
AVL 树和红黑树
AVL 树的平衡标准比较严格,即一个节点的左右子树的高度差不能超过 1,搜索、添加和删除操作都是 O(logn),添加元素只需要 O(1) 次旋转,删除元素最多需要 O(logn) 次旋转。
红黑树是比较宽松的,没有一条路径的节点数量会大于其他路径节点数量的 2 倍。搜索、添加和删除操作都是 O(logn),添加或者删除元素都只需要 O(1) 次的旋转。
因为 AVL 树的平衡标准比红黑树要高,所以在搜索方面,AVL 树的效率也是比红黑树大。但是在添加或者删除后需要旋转的次数比红黑树要多。这就可以总结出搜索次数远远大于插入和删除时,选择 AVL 树;搜索、插入、删除的次数都差不多,可以选择红黑树。
在实际应用中,选择更多的是红黑树,因为应用红黑树统计的平均性能要比 AVL 好一些。