前言
本篇文章我们要讲解的是红黑树,它是综合性能更为极致的一颗二叉搜索树,并且我们在后续的容器的学习中也可以知道它们的底层数据结构使用的就是红黑树,下面就让我们一起来学习吧!!
一、红黑树的概念
红黑树,是一种二叉搜索树,但在每个结点上增加一个存储位表示结点的颜色,可以是Red或Black。 通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路径会比其他路径长出俩倍,因而是接近平衡的。
二、红黑树的性质
- 1. 每个结点不是红色就是黑色
- 2. 根节点是黑色的
- 3. 如果一个节点是红色的,则它的两个孩子结点是黑色的
- 4. 对于每个结点,从该结点到其所有后代叶结点的简单路径上,均包含相同数目的黑色结点
- 5.每个叶子结点都是黑色的(此处的叶子结点指的是空结点) ps:这条规则主要是为了更清楚的知道有多少条路径而已!
Q:思考:为什么满足上面的性质,红黑树就能保证:其最长路径中节点个数不会超过最短路径节点个数的两倍?
我们可以从极限的角度来理解这个问题,假设一颗红黑树中有N个黑色节点,那么最短路径为 l o g 2 N log_2N log2N(全为黑的情况),最长路径为2 l o g 2 N log_2N log2N(一黑一红的情况),所以就保证了这个问题!!
三、红黑树节点的定义
enum Color
{
RED,
BLACK,
};
template<class K, class V>
struct RBTreeNode
{
RBTreeNode<K, V>* _left;
RBTreeNode<K, V>* _right;
RBTreeNode<K, V>* _parent;
pair<K, V> _kv;
Color _col;
RBTreeNode(const pair<K, V>& kv)
: _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
, _kv(kv)
, _col(RED)
{}
};
Q:新增节点默认为什么颜色??
假设新增节点的默认颜色为黑色的话,那么是不是就破坏了规则4,即从该结点到其所有后代叶结点的简单路径上均包含相同数目的黑色结点,新增节点为黑色影响了所有路径的黑色节点个数;而如果新增节点为红色的话,我们可能会破坏规则3即红色节点的左右孩子必须为黑色节点,意思就是不能出现两个连续的红色节点。我们将两者的影响范围做对比,新增节点为黑色必定影响到了整棵树,而新增节点为红色可能会影响整棵树,从概率上来讨论我们也应该选择后者作为新增节点的颜色!!即新增节点的颜色默认为红色!!
三、红黑树的插入操作
红黑树是在二叉搜索树的基础上加上其平衡限制条件,因此红黑树的插入可分为两步:
- 1. 按照二叉搜索的树规则插入新节点
bool Insert(const pair<K, V>& kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
_root->_col = BLACK; // 规则一: 根节点的颜色为黑
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(kv);
if (parent->_kv.first > kv.first)
{
parent->_left = cur;
}
else
{
parent->_right = cur;
}
cur->_parent = parent;
// ............ 进行后续的调整工作
return true;
}
- 2. 检测新节点插入后,红黑树的性质是否造到破坏
因为新节点的默认颜色是红色,因此:如果其双亲节点的颜色是黑色,没有违反红黑树任何性质,则不需要调整;但当新插入节点的双亲节点颜色为红色时,就违反了性质三不能有连在一起的红色节点,此时需要对红黑树分情况来讨论:
约定: cur为当前节点,parent为父节点,grandfather为祖父节点,uncle为叔叔节点
注:以下所看到的树,可能是一颗完整的数,也可能是一颗子树。
- 情况一:cur为红,p为红,g为黑,u存在且为红
- 情况二: cur为红,p为红,g为黑,u不存在/u存在且为黑
- 情况三: cur为红,p为红,g为黑,u不存在/u存在且为黑
其实情况三更情况二是完全一致的,只是情况二是单旋而情况三是双旋而已!!
bool Insert(const pair<K, V>& kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
_root->_col = BLACK; // 根节点为黑
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(kv);
if (parent->_kv.first > kv.first)
{
parent->_left = cur;
}
else
{
parent->_right = cur;
}
cur->_parent = parent;
// 新增的结点默认为红色,如果它的父节点为红色此时就需要进行调整了
while (parent && parent->_col == RED)
{
Node* grandfather = parent->_parent;
if (grandfather->_left == parent) // 两个方向
{
Node* uncle = grandfather->_right;
// 情况1:u存在并且为红色,此时需要进行变色处理,继续向上进行调整
if (uncle && uncle->_col == RED)
{
parent->_col = BLACK;
uncle->_col = BLACK;
grandfather->_col = RED;
cur = grandfather;
parent = cur->_parent;
}
//情况2 + 3: u不存在/u存在且为黑-- > 旋转 + 变色
else
{
// 右单旋, 当p和cur处于同一线上时, 高度为同一个线
if (cur == parent->_left)
{
RotateR(grandfather);
parent->_col = BLACK;
grandfather->_col = RED;
}
// 左右双旋, p和cur不在同一线上,为折线需要先将其统一一个方向
else
{
RotateL(parent);
RotateR(grandfather);
cur->_col = BLACK;
grandfather->_col = RED;
}
// 当进行了旋转之后,此时子树的根结点或_root都变黑了 不需要继续向上进行调整了
break;
}
}
else
{
Node* uncle = grandfather->_left;
if (uncle && uncle->_col == RED)
{
parent->_col = BLACK;
uncle->_col = BLACK;
grandfather->_col = RED;
cur = grandfather;
parent = cur->_parent;
}
else
{
if (cur == parent->_right)
{
RotateL(grandfather);
grandfather->_col = RED;
parent->_col = BLACK;
}
else
{
RotateR(parent);
RotateL(grandfather);
cur->_col = BLACK;
grandfather->_col = RED;
}
break;
}
}
}
_root->_col = BLACK; // 不论什么情况 根节点一定为黑
return true;
}
同样的这里我们也不会去实现删除操作,感兴趣的大家自己去查阅资料实现!!
四、红黑树与AVL树的比较
红黑树和AVL树都是高效的平衡二叉树,增删改查的时间复杂度都是O( l o g 2 N log_2 N log2N),红黑树不追求绝对平衡,其只需保证最长路径不超过最短路径的2倍,相对而言,降低了插入和旋转的次数,所以在经常进行增删的结构中性能比AVL树更优,而且红黑树实现比较简单,所以实际运用中红黑树更多。