什么是AVL树?
AVL树是解决二叉搜索树极端情况下的单支树问题,具有以下性质即可做到增删改查都是log(N).
AVL树首先得是一颗二叉搜索树:
1.它的左右子树都是AVL树
2.左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
平衡因子 = 右子树的高度–左子树的高度
我们来求一下AVL树的高度大概是多少?
满二叉树 总结点数和高度关系 2^h -1 = N,(满二叉树需要符合AVL树条件)
AVL树 总结点数比满二叉树要少一部分,因为这中间缺了一些节点
所以总结点数和高度关系为 2^h - X = N
X范围: [1, 2^(h-1)-1] ,要么X就是1,节点数是满的,要么就是最后一层只剩一个节点(我觉得是因为要保证高度)。
AVL树把X等于1和2^(h-1)-1带进去,算h,
X=1时h = logn;
X=2^(h-1)-1时
我们可以利用,
这个式子算出2^(h-1) -1大概是N/2 ,把它代入进 2^h - X = N,可以算出h ≈ 3/2 * N。
则增删改查就是高度次 logn。
问题
AVL==高度平衡的二叉树搜索树
那平衡为什么不是相等?
而是高度差不超过1
因为插入时保证不了一直是完全满足高度差是0
插入
插入就根据搜索树的规则,从根节点开始一直往下,比节点大就去节点的右边,比节点小就去节点的左边,
假如Cur = 7.5 就会插入到Cur位置上。
因为插入可能会导致其祖先节点高度变化,导致不再是一颗AVL树,所以我们得更新祖先节点的平衡因子。
当然先要看插入cur后的Parent平衡因子是否会影响高度变化。
1、新增在左,parent平衡因子减减
2、新增在右, parent平衡因子加加
3、更新后parent平衡因子 = = 0,说明parent所在的子树的高度不变,不会再影响祖先,不用再继续沿着到root的路径往上更新
4、更新后parent平衡因子= = 1 or -1,说明parent所在的子树的高度变化,会再影响祖先,需要继续沿着到root的路径往上更新
5、更新后parent平衡因子= = 2 or -2,说明parent所在的子树的高度变化且不平衡,需要对parent所在子树进行旋转,让他平衡
6、更到根节点
图上的箭头表示,他们会有多个插入结束点。
可能插入完parent平衡因子是0,那就结束了
,或者是旋转,旋转后也平衡了。
也可能一直更新到根节点那也结束了。
也有可能需要继续向上继续向上更新
可能插入完parent平衡因子是1 or -1,继续向上更新,根据cur 在 Parent的左边还是右边 修改平衡因子,
直到这颗树平衡。
转换为代码就是
节点设置
我们需要三叉链,除了指向左右子树的指针还需要指向父亲的指针。
因为KV结构,我们需要返回两个返回值,而函数返回值又无法返回两个,则设置pair结构体直接返回pair。
还需要bf平衡因子。
一直向下走插入到parent的左或者右。
控制平衡
更新平衡因子
最坏更新到根节点
AVL树插入的整体流程就是如此。
剩下就是研究该怎么旋转以及平衡因子的更新问题。
为什么会发生旋转,是因为单纯一边高,那么就要往另一边压一下。
左单选
假如往c插入,就会导致30和60平衡因子变为2 和 1,这就是单纯的右边高,需要左旋。
左旋把b变为30的右子树,30变为60的左子树,因为b一定都比30大,60又大于30和b,旋转完符合搜索树的要求。
依照图来看30的左右子树高度相同,则平衡因子是0,而60的左右子树高度也相同,所以他们俩因子都是0。
问题
为什么30和60的平衡因子敢直接给0?
还有一个问题
插入新节点到c,那我插入到b导致60的因子是-1,此时30就是2,也就是 2 和 -1 此时还是左单旋吗?后面用双旋来解决。
图下是给出了插入在b的列子,依旧用左单旋处理而做不到平衡。
a/b/c因为子树高度不同,会有无数种组合的情况,而且c这颗子树不一定是所有满足高度的子树都会引发30和60的因子变化。
a/bc三颗子树的高度h==2时,有三种可能就是上面的x/y/z,
为什么说a和b是任意一种,但c一定是z呢?
因为c如果是x和y,插入一个新节点到x/y会有两种情况:
1.插入到x/y根节点右子树,直接平衡,则不会引发30和60的变化及其旋转。
2.插入到x/y的根节点左子树的左右子树,直接引发x/y这颗子树的旋转而不会引发30和60的旋转。
所以c一定是z才会引发30 和 60 的旋转。
因为a和b是3种情况,c是1种,则3x3x1=9,又因为新节点可以插入到z的叶子节点的四个位置,则4x9=36一共有36种组合情况。
h == 3 时,目前只想出一种情况。
右单选
会左旋就会右旋,这部分代码其实不那么重要了,重要的是需要画图,跟这图走。
右左双旋
双旋你会观察到其实是一个折线,而不是像单旋一样是直线。如果此时依旧用单旋处理仍旧不平衡
那也没什么,你就先右旋再左旋。
有人会说为什么60这颗树要这样画,要显示出60和h-1的子树,和原来单旋不一样,直接把60变成b子树不就得了?
因为双旋涉及了60这个节点的变化。
进行双旋后暴力的把30 60 90的平衡因子都设置为0,这是不对的,有的情况他就不都是0。
分情况讨论
h == 0
60本身作为新节点插入,此时三个节点因子都是0
h > 0
区分关键:看60的平衡因子
双旋的结果本质:
60的左边给30的右边
60的右边给90的左边
60成了这颗树的根
新节点插入在60右边,60的右边给了90的左边,30的因子就是-1
新节点插入在60的左边,60的左边给了30的右边,90的因子就是1