目录
1:AVL树的概念
二叉搜索树(BST)的问题:
-
有序数据:如果插入的数据本身是有序的,或者接近有序,那么在二叉搜索树中,这些数据可能会形成一条链(单支树),导致树的高度接近数据的数量级。
-
性能退化:在最坏的情况下,BST的性能会退化成线性结构,即顺序表,此时查找操作的时间复杂度为 O(n),n 是树中元素的数量。
自平衡二叉搜索树(balanced binary search tree)的解决方案:
为了解决上述问题,保持二叉搜索树的平衡非常重要。两位俄罗斯数学家 G.M.Adelson-Velskii 和 E.M.Landis 在 1962 年提出了自平衡二叉搜索树的概念:
-
平衡条件:自平衡二叉搜索树要求任何节点的左右子树的高度(或深度)之差的绝对值不超过 1。
-
自动调整:当新节点插入或旧节点删除后,自平衡二叉搜索树会自动进行调整,以保持平衡条件。
-
降低树高:通过保持树的平衡,树的高度被控制在 O(log n),从而确保大多数操作(如搜索、插入、删除)的平均时间复杂度也是 O(log n)。
常见的自平衡二叉搜索树:
-
AVL 树:一种严格平衡的二叉搜索树,它在每次插入或删除操作后通过旋转保持平衡。
-
红黑树:另一种自平衡的二叉搜索树,它通过颜色规则和旋转来保持平衡,允许更灵活的插入和删除操作。
2:AVL树的性质
一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:
A:它的左右子树都是AVL树。
B:左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)。
D:平衡因子(balance factor):节点左子树的高度减去右子树的高度。
如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在O(log n),搜索时间复杂度O(log n)。
3:AVL树节点的定义
template<class K, class V>
struct AVLTNode
{
AVLTNode<K, V>* _parent;//双亲节点
AVLTNode<K, V>* _left;//左子节点
AVLTNode<K, V>* _right;//右子节点
pair<K, V> _kv;
// 这个和map类似
int _bf; //平衡因子:balance factor
AVLTNode(const pair<K, V>& kv)
:_parent(nullptr)
, _left(nullptr)
, _right(nullptr)
, _kv(kv)
, _bf(0)
{}
};
4: AVL树的插入
AVL树就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看成是二叉搜索树,插入步骤:
1. 按照二叉搜索树的方式插入新节点
2. 调整节点的平衡因子
bool Insert(const pair<K, V>& kv)
{
if (_root == nullptr)
{
_root = new AVLTNode(kv);
return true;
}
AVLTNode* parent = nullptr;
AVLTNode* cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else//等于的情况
{
return false;
}
}
cur = new AVLTNode(kv);
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
//到此插入完成
//更新平衡因子
while (parent) {
if (cur == parent->_left) parent->_bf--;
else parent->_bf++;
if (parent->_bf == 0) break;
else if (parent->_bf == 1 || parent->_bf == -1)
{
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == 2 || parent->_bf == -2) {
//根据平衡因子判断是否需要旋转,该怎样旋转
if (parent->_bf == -2 && cur->_bf == -1) {
RotateR(parent);
}
else if (parent->_bf == 2 && cur->_bf == 1) {
RotateL(parent);
}
else if (parent->_bf == 2 && cur->_bf == -1) {
RotateRL(parent);
}
else if (parent->_bf == -2 && cur->_bf == 1) {
RotateLR(parent);
}
break;
}
else {
assert(false);
}
}
return true;
}
5:AVL树的旋转
如果在一棵原本是平衡的AVL树中插入一个新节点,可能造成不平衡,此时必须调整树的结构,使之平衡化。根据节点插入位置的不同,AVL树的旋转分为四种:
1. 新节点插入较高左子树的左侧 -> 左左:右单旋!
2. 新节点插入较高右子树的右侧 -> 右右:左单旋!
3. 新节点插入较高左子树的右侧 -> 左右:先左单旋再右单旋!
4. 新节点插入较高右子树的左侧 -> 右左:先右单旋再左单旋
总结:
假如以pParent为根的子树不平衡,即pParent的平衡因子为2或者-2,分以下情况考虑:
1. pParent的平衡因子为2,说明pParent的右子树高,设pParent的右子树的根为pSubR
当pSubR(右孩子)的平衡因子为1时,执行左单旋
当pSubR(右孩子)的平衡因子为-1时,执行右左双旋
2. pParent的平衡因子为-2,说明pParent的左子树高,设pParent的左子树的根为pSubL
当pSubL(左孩子)的平衡因子为-1是,执行右单旋
当pSubL(左孩子)的平衡因子为1时,执行左右双旋
旋转完成后,原pParent为根的子树个高度降低,已经平衡,不需要再向上更新。
6. AVL树的验证
AVL树是在二叉搜索树的基础上加入了平衡性的限制,因此要验证AVL树,可以分两步:
1. 验证其为二叉搜索树
如果中序遍历可得到一个有序的序列,就说明为二叉搜索树
2. 验证其为平衡树
a:每个节点子树高度差的绝对值不超过1(注意节点中如果没有平衡因子)
b:节点的平衡因子是否计算正确
bool _IsBalance(AVLTNode* root) {
if (root == nullptr) return true;
int LH = _Height(root->_left);
int RH = _Height(root->_right);
if (abs(LH - RH) >= 2) return false;
if (RH - LH != root->_bf) return false;
return _IsBalance(root->_left) && _IsBalance(root->_right);
}
int _Height(AVLTNode* root) {
if (root == nullptr) return 0;
return max(_Height(root->_left), _Height(root->_right) ) + 1;
}
7. AVL树的性能
AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即O(logN)。但是如果要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置。因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合。
8. AVL树的实现