平衡二叉树
严格定义是这样的:二叉树中任意一个节点的左右子树的高度相差不能大于 1。(像完全二叉树、满二叉树其实就是平衡二叉树)
实际应用中平衡二叉查找树中“平衡”的意思,其实就是让整棵树左右看起来比较“对称”、比较“平衡”。并不会死抠定义,高度差大于一也是可以的。
红黑树(Red-Black Tree,简称 R-B Tree)
它就是一种不严格的平衡二叉查找树
红黑树中的节点,一类被标记为黑色,一类被标记为红色。
要求:
- 根节点是黑色的;
- 每个叶子节点都是黑色的空节点(NIL),也就是说,叶子节点不存储数据;(为了实现方便)
- 任何相邻的节点都不能同时为红色,也就是说,红色节点是被黑色节点隔开的;
- 每个节点,从该节点到达其可达叶子节点的所有路径,都包含相同数目的黑色节点;
省略掉了空的黑色叶子节点:
工程中大家都喜欢用红黑树这种平衡二叉查找树?
AVL 树是一种高度平衡的二叉树,所以查找的效率非常高,但是,有利就有弊,AVL 树为了维持这种高度的平衡,就要付出更多的代价。每次插入、删除都要做调整,就比较复杂、耗时。
红黑树的高度近似 2log2n, 比AVL 树的高度(log2n)仅仅大了一倍,在性能上,下降得并不多。实际开发中红黑树的性能更好。(树里面的复杂度logn准来说都是log2n)
红黑树的插入、删除、查找各种操作性能都比较稳定。对于工程应用来说,要面对各种异常情况,为了支撑这种工业级的应用,我们更倾向于这种性能稳定的平衡二叉查找树。
总结:动态数据结构
动态数据结构就是查询、插入、删除效率都不错的数据结构。
-
散列表:插入删除查找都是O(1), 是最常用的,但其缺点是不能顺序遍历以及扩容缩容的性能损耗。适用于那些不需要有序遍历,数据更新不那么频繁的。(如果非要有序就使用LinkedHashMap)
-
跳表:插入删除查找都是O(logn), 并且能排序遍历。缺点是空间复杂度O(n)。适用于不那么在意内存空间的,其顺序遍历和区间查找非常方便。
-
红黑树:插入删除查找都是O(logn), 中序遍历即是排序遍历,稳定。缺点是难以实现。其实跳表更佳,但红黑树已经用于很多地方了。