C++——一种特殊的二叉搜索树之AVL树

接——map和set的应用总结

序言

前面对map/multimap/set/multiset进行了简单的介绍,在其文档介绍中发现,这几个容器有个共同点是:其底层都是按照二叉搜索树来实现的,但是二叉搜索树有其自身的缺陷,假如往树中插入的元素有序或者接近有序,二叉搜索树就会退化成单支树,时间复杂度会退化成O(N),因此map、set等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡树来实现。

1 AVL树的概念

二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。

一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:

  • 它的左右子树都是AVL树
  • 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
    在这里插入图片描述
    如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在 O ( l o g 2 n ) O(log_2 n) O(log2n),搜索时间复杂度O( l o g 2 n log_2 n log2n)。

2 AVL树节点的定义

AVL树节点的定义:
平衡因子(_bf)=右子树的高度-左子树的高度

struct AVLTreeNode
{
	pair<K, V> _kv;//键值对
	AVLTreeNode<K, V>* _left;
	AVLTreeNode<K, V>* _right;
	AVLTreeNode<K, V>* _parent;

	int _bf;  // 平衡因子 balance factor=右子树的高度-左子树的高度

	AVLTreeNode(const pair<K, V>& kv)
		:_kv(kv)
		, _left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
		, _bf(0)
	{}
};

3 AVL树的插入

AVL树就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看成是二叉搜索树。
那么AVL树的插入过程可以分为两步:

  1. 按照二叉搜索树的方式插入新节点
  2. 调整节点的平衡因子

是否继续更新依据:子树的高度是否变化

下面拿一个右单旋的图来说明一下parent、subL、subLR三者之间的关系,让读者更能理解这里向上更新平衡因子的逻辑。
在这里插入图片描述

更新之后如果:(_bf为该节点的平衡因子,平衡因子=右子树的高度-左子树的高度

  • parent->_bf == 0,那么之前parent->_bf是 1 或者 -1。
    说明之前parent一边高一边低,这次插入填上矮的那边,parent所在子树整体高度不变,对于parent的双亲结点没有影响,不需要继续往上更新。

  • parent->_bf == 1 或 -1,之前是parent->_bf == 0。
    说明插入前两边一样高,现在插入一边更高了,parent所在子树高度变了,继续往上更新。

  • parent->_bf == 2 或 -2,之前parent->_bf == 1 或者 -1。
    现在插入一个新节点后严重不平衡,违反规则需要就地处理——旋转,如何旋转?下面会有介绍。

AVL树的插入代码整体框架:

bool Insert(const pair<K, V>& kv)
{
	if (_root == nullptr)//如果当前是空树
	{
		_root = new Node(kv);
		return true;
	}
	
	//向下找该结点的插入位置
	//开始向下寻找该要被插入结点的父节点
	Node* parent = nullptr;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < kv.first)
		{
			parent = cur;
			cur = cur->_right;//往右走
		}
		else if (cur->_kv.first > kv.first)
		{
			parent = cur;
			cur = cur->_left;//往左走
		}
		else
		{
			return false;//不能插入相等(重复)的值
		}
	}
	//找到位置然后正确的将结点插入
	cur = new Node(kv);
	if (parent->_kv.first < kv.first)
	{
		parent->_right = cur;
		cur->_parent = parent;
	}
	else
	{
		parent->_left = cur;
		cur->_parent = parent;
	}

	// 1、开始向上更新 平衡因子
	while (parent) // parent为空,也就更新到根了
	{
		// 新增在右,parent->bf++;
		// 新增在左,parent->bf--;
		if (cur == parent->_left)
		{
			parent->_bf--;
		}
		else
		{
			parent->_bf++;
		}
		
		//parent->_bf == 0,那么之前parent->_bf是 1 或者 -1
		//说明之前parent一边高一边低,这次插入填上矮的那边,parent所在子树整体高度不变,
		//对于parent的双亲结点没有影响,不需要继续往上更新,退出更新的循环
		if (parent->_bf == 0)
		{
			break;
		}
		//parent->_bf == 1 或 -1,说明之前是parent->_bf == 0,两边一样高,
		//现在插入一边更高了,parent所在子树高度变了,继续往上更新。
		else if (parent->_bf == 1 || parent->_bf == -1)
		{
			cur = parent;
			parent = parent->_parent;
		}
		// parent->_bf == 2 或 -2,说明之前parent->_bf == 1 或者 -1,
		// 现在插入严重不平衡,违反规则需要就地处理——旋转
		else if (parent->_bf == 2 || parent->_bf == -2)
		{
			//左单旋
			if (parent->_bf == 2 && cur->_bf == 1)
			{
				RotateL(parent);
			}
			//右单旋
			else if (parent->_bf == -2 && cur->_bf == -1)
			{
				RotateR(parent);
			}
			//左右双旋
			else if (parent->_bf == -2 && cur->_bf == 1)
			{
				RotateLR(parent);
			}
			//右左双旋
			else if (parent->_bf == 2 && cur->_bf == -1)
			{
				RotateRL(parent);
			}
			
			else
			{
				assert(false);
			}
			break;
		}
		else
		{
			assert(false);
		}
	}

	return true;
}

4 AVL树的旋转

旋转的原则:

1、让这颗子树左右高度不超过1
2、旋转过程中继续保持是搜索树
3、更新调整节点的平衡因子
4、让这颗子树的高度跟插入前保持一致

如果在一棵原本是平衡的AVL树中插入一个新节点,可能造成不平衡,此时必须调整树的结构,使之平衡化。根据节点插入位置的不同,AVL树的旋转分为四种:

1. 新节点插入较高左子树的左侧—左左:右单旋

在这里插入图片描述
上图在插入前,AVL树是平衡的,新节点插入到30的左子树(注意:此处不是左孩子)中,30左子树增加了一层,导致以60为根的二叉树不平衡,要让60平衡,只能将60左子树的高度减少一层,右子树增加一层,即将左子树往上提,这样60转下来,因为60比30大,只能将其放在30的右子树,而如果30有右子树,右子树根的值一定大于30,小于60,只能将其放在60的左子树,旋转完成后,更新节点的平衡因子即可。

在旋转过程中,编写程序时有以下几种情况需要考虑:

  • 30节点的右孩子可能存在,也可能不存在
  • 60可能是根节点,也可能是子树。如果是根节点,旋转完成后,要更新根节点;如果是子树,可能是某个节点的左子树,也可能是右子树。

代码及注释:

void RotateR(Node* parent)
{
	// SubL: parent的左孩子
	// SubLR: parent左孩子的右孩子,注意:该结点可能为空
	Node* subL = parent->_left;
	Node* subLR = subL->_right;

	// 旋转完成之后,30的右孩子作为60的左孩子
	parent->_left = subLR;
	// 并且如果30的右孩子存在,因为时三叉连,需要更换其双亲结点parent为60
	if (subLR)
	{
		subLR->_parent = parent;
	}

	// 因为60可能是棵子树,因此在更新其双亲前必须先保存60的双亲
	Node* ppNode = parent->_parent;
	// 60 作为 30的右孩子
	subL->_right = parent;
	// 更新60的双亲
	parent->_parent = subL;

	// 如果60是根节点,根新指向根节点的指针
	//if (_root == parent)
	if (ppNode == nullptr)
	{
		_root = subL;
		_root->_parent = nullptr;
	}
	else
	{
		// 如果60是子树,可能是其双亲的左子树,也可能是右子树
		if (ppNode->_left == parent)
		{
			ppNode->_left = subL;
		}
		else
		{
			ppNode->_right = subL;
		}
		//更新subL也就是30的双亲结点
		subL->_parent = ppNode;
	}
	// 根据调整后的结构更新部分节点的平衡因子,看图调整即可,右单旋都是固定的
	subL->_bf = parent->_bf = 0;
}

2. 新节点插入较高右子树的右侧—右右:左单旋

在这里插入图片描述

实现及情况考虑可参考右单旋,这里就不多赘述了。
参考代码:

void RotateL(Node* parent)
{
	Node* subR = parent->_right;
	Node* subRL = subR->_left;

	parent->_right = subRL;
	if (subRL)
		subRL->_parent = parent;

	Node* ppNode = parent->_parent;
	subR->_left = parent;
	parent->_parent = subR;

	if (ppNode == nullptr)
	{
		_root = subR;
		_root->_parent = nullptr;
	}
	else
	{
		if (ppNode->_left == parent)
		{
			ppNode->_left = subR;
		}
		else
		{
			ppNode->_right = subR;
		}

		subR->_parent = ppNode;
	}

	parent->_bf = subR->_bf = 0;
}

3. 新节点插入较高左子树的右侧—左右:先左单旋再右单旋

在这里插入图片描述

将双旋变成单旋后再旋转,即:先对30进行左单旋,然后再对90进行右单旋,旋转完成后再考虑平衡因子的更新。
判断整体的平衡因子的重要依据就是看60旋转前的平衡因子,从图中可以知道,60的左右孩子分别变成30的右孩子和90的左孩子,所以最终平衡因子的判断只需要看是

  • 在60的左边b新增(平衡因子:30->0,60->0,90->1)
  • 还是在60右边c新增(平衡因子:30->-1,60->0,90->0)
  • 60自己就是新增的结点,那么之前a、d的高度一定是0(否则插入60之前就不是一颗AVL树了)(平衡因子:30->0,60->0,90->0)
    在这里插入图片描述
void RotateLR(Node* parent)
{
	Node* subL = parent->_left;//30
	Node* subLR = subL->_right;//60

	//最后判断整体的平衡因子的重要依据就是看60的平衡因子,从图中可以知道,60的左右孩子分别变成,
	//30的有孩子和90的左孩子,所以最终平衡因子的判断只需要看在60的左边b新增,还是右边c新增即可
	int bf = subLR->_bf;
	//对30进行左旋
	RotateL(parent->_left);
	//对90进行右旋
	RotateR(parent);

	if (bf == -1) // 60左子树新增
	{
		subL->_bf = 0;
		parent->_bf = 1;
		subLR->_bf = 0;
	}
	else if (bf == 1) // 60右子树新增
	{
		parent->_bf = 0;
		subL->_bf = -1;
		subLR->_bf = 0;
	}
	else if (bf == 0) // 60自己就是新增结点
	{
		parent->_bf = 0;
		subL->_bf = 0;
		subLR->_bf = 0;
	}//其他情况就报断言错误
	else
	{
		assert(false);
	}
}

4. 新节点插入较高右子树的左侧—右左:先右单旋再左单旋

具体细节可参考左右双旋,先对90进行右单旋,然后再对30进行左单旋,旋转完成后再考虑平衡因子的更新。
判断整体的平衡因子的重要依据就是看60旋转前的平衡因子,从图中可以知道,60的左右孩子分别变成30的右孩子和90的左孩子,所以最终平衡因子的判断只需要看在60的左边b新增,还是右边c新增,或者说自己就是新增的结点即可。
在这里插入图片描述

代码:

void RotateRL(Node* parent)
{
	Node* subR = parent->_right;
	Node* subRL = subR->_left;
	int bf = subRL->_bf;
	RotateR(parent->_right);
	RotateL(parent);

	if (bf == 1)
	{
		subR->_bf = 0;
		subRL->_bf = 0;
		parent->_bf = -1;
	}
	else if (bf == -1)
	{
		subR->_bf = 1;
		subRL->_bf = 0;
		parent->_bf = 0;
	}
	else if (bf == 0)
	{
		subR->_bf = 0;
		subRL->_bf = 0;
		parent->_bf = 0;
	}
	else
	{
		assert(false);
	}
}

总结:
假如以parent为根的子树不平衡,即parent的平衡因子为2或者-2,分以下情况考虑:

  • parent的平衡因子为2,说明parent的右子树高,设parent的右子树的根为subR
    当subR的平衡因子为1时,执行左单旋
    当subR的平衡因子为-1时,执行右左双旋
  • parent的平衡因子为-2,说明parent的左子树高,设parent的左子树的根为subL
    当subL的平衡因子为-1是,执行右单旋
    当subL的平衡因子为1时,执行左右双旋

旋转完成后,原parent为根的子树个高度降低,已经平衡,不需要再向上更新。


5.如何验证一颗树是AVL树?

AVL树是在二叉搜索树的基础上加入了平衡性的限制,因此要验证AVL树,可以分两步:

  1. 验证其为二叉搜索树
    如果中序遍历可得到一个有序的序列,就说明为二叉搜索树
  2. 验证其为平衡树
  • 每个节点子树高度差的绝对值不超过1(注意节点中如果没有平衡因子)
  • 节点的平衡因子是否计算正确
void Inorder()//封装中序遍历函数,防止直接访问根节点_root
{
	_Inorder(_root);
}

void _Inorder(Node* root)
{
	if (root == nullptr)
		return;

	_Inorder(root->_left);
	cout << root->_kv.first << ":" << root->_kv.second << endl;
	_Inorder(root->_right);
}

int Height(Node* root)
{
	if (root == nullptr)
		return 0;
	
	int lh = Height(root->_left);
	int rh = Height(root->_right);

	return lh > rh ? lh + 1 : rh + 1;
}

bool IsBalance()//封装判断平衡函数,防止直接访问根节点_root
{
	return IsBalance(_root);
}

bool IsBalance(Node* root)
{
	if (root == nullptr)
	{
		return true;
	}

	int leftHeight = Height(root->_left);
	int rightHeight = Height(root->_right);

	if (rightHeight - leftHeight != root->_bf)
	{
		cout <<root->_kv.first<<"平衡因子异常" << endl;//和当前标识的平衡因子不符
		return false;
	}

	return abs(rightHeight - leftHeight) < 2//平衡因子大于等于2就不是一个AVL树了
		&& IsBalance(root->_left)
		&& IsBalance(root->_right);
}

6 AVL树的删除(了解)

因为AVL树也是二叉搜索树,可按照二叉搜索树的方式将节点删除,然后再更新平衡因子,只不过与删除不同的时,删除节点后的平衡因子更新,最差情况下一直要调整到根节点的位置。具体实现可参考《算法导论》或《数据结构-用面向对象方法与C++描述》殷人昆版。

7 AVL树的性能

AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即 l o g 2 ( N ) log_2 (N) log2(N)。但是如果要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,通过频繁的旋转才达到这样的绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置。因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合。
红黑树会减少一些旋转次数,插入数据时相比AVL树就不会那么严格。

AVL树完整代码链接

推荐阅读:C++——一种特殊的二叉搜索树之红黑树

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

有效的放假者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值