二叉排序树/二叉查找树/二叉搜索树:
https://blog.csdn.net/yixianfeng41/article/details/52802855
1、就是若它的左子树不空,则左子树上所有节点的值均小于它的根节点的值;
2、若它的右子树不空,则右子树上所有节点的值均大于其根节点的值。
3、换句话说就是:任何节点的键值一定大于其左子树中的每一个节点的键值,并小于其右子树中的每一个节点的键值。
优点:下图你要查找15,只需要17→12→15查找3次即15的高度即可,效率很高
缺点:如图二,二叉树变成“瘸子”了,要查找3几乎要遍历了整棵树,效率很差
总结:如果一棵树是“平衡”的,即左右子树高度差不超过1,那么二叉排序树还是挺不错的
如下图一便是一颗二叉排序树:
图一
图二
红黑树:自平衡二叉树
https://www.sohu.com/a/201923614_466939
1.节点是红色或黑色。
2.根节点是黑色。
3.每个叶子节点都是黑色的空节点(NIL节点)。
4 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
5.从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。
6.红黑树完全符合二叉搜索树的特点
难点:换色+旋转(左旋转+右旋转)
好处:TreeMap、TreeSet都用到,jdk8的hashmap也用了;树里最长链长度不超过最短链的两倍
坏处:换色、旋转理解起来比较难。这两个方法时用在插入节点删除节点,当你任意插入一个红色节点(默认红色,我看的资料插入的节点都是红色,虽然没有看到明文规定,但我默认插入就是红色),这时候有可能引发规则1/规则4/规则5矛盾,这时候把改节点的父节点进行换色(黑节点变红/红节点变黑),或者直接使用旋转(旋转表达起来很抽象,请看https://www.sohu.com/a/201923614_466939),直到重新符合红黑树定义。
AVL树/高度平衡的二叉搜索树
1.它的左子树和右子树都是AVL树
2.左子树和右子树的高度差不能超过1
为了保证平衡,AVL树中的每个结点都有一个平衡因子(balance factor,以下用BF表示),它表示这个结点的左、右子树的高度差,也就是左子树的高度减去右子树的高度的结果值。AVL树上所有结点的BF值只能是-1、0、1。反之,只要二叉树上一个结点的BF的绝对值大于1,则该二叉树就不是平衡二叉树。
如何使AVL树重新平衡呢?有四种方法,分别是左旋转、右旋转、左右旋转和右左旋转
B树
https://blog.csdn.net/u011109881/article/details/80344606
B树跟之前讲的二叉树最大区别就是多叉
- 1.根结点至少有两个子女。
- 2.每个中间节点包含k-1个元素和k个孩子,其中 m/2向上取整 <= k <= m
- 3.每一个叶子节点包含k-1个元素,其中 m/2向上取整 <= k <= m
- 4.所有的叶子结点都位于同一层。
- 5.每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划。
好处:当m阶B树的m越大,单一节点的元素树越多,B树的高度就越低,IO访问的次数就越少。
坏处:但是,也不是m越大越好,当m大到m个数据,外存一个磁盘页装不下就糟了。因此m是受磁盘页大小限制的
应用:MongDB、文件系统索引
B+树
https://blog.csdn.net/u011109881/article/details/80344606
- 1.有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。
- 2.所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。
- 3.所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。
如下便是一个B+树
优点:
1.首先,由于B+树只有根节点存储了元素数据,所以必须查到叶子节点。其次由于非叶子节点只存储索引,所以可以存储的索引树更多,能够使得B+树的高度更低,IO次数更少。
2.所有查询都要查找到叶子节点,查询性能稳定。(同样是因为非叶子节点不存储数据,数据只有叶子节点有)
3.所有叶子节点形成有序链表,便于范围查询。
最后附上一张图