第十二章 二叉搜索树
搜索树数据结构支持许多动态集合操作,包括WALK(遍历)、SEARCH(搜索)、MINIMUM(最小值)、MAXIMUM(最高分)、PREDECESSOR(先驱)、SUCCESSOR(后继)、INSERT(插入)和DELETE(删除)等。因此,我们使用一棵搜索树既可以作为一个字典又可以作为一个优先队列。
二叉搜索树上的基本操作所花费的时间与这棵树的高度成正比。对于有n个节点的一棵完全二叉树来说,这些操作的最坏运行时间为 Θ ( lg n ) \Theta(\lg{n}) Θ(lgn)。
12.1 二叉搜索树的定义
一棵二叉搜索树是以一棵二叉树来组织的。除了key和卫星数据1之外,每个节点还包括left、right和p,它们分别指向节点的左孩子、右孩子和双亲。如果某个孩子节点和父节点不存在,则相应属性的值为NIL。跟节点是树中唯一父指针为NIL的节点。
二叉搜索树中的关键字总是以满足二叉搜索树性质的方式来存储:
设x是二叉搜索树中的一个节点。如果y是x左子树中的一个节点,那么y.key
≤
\leq
≤x.key。如果y是x右子树中的一个节点,那么y.key
≥
\geq
≥x.key。
12.2 查询二叉搜索树
遍历(中序)
如果x是一棵有n个节点子数的根,那么调用 INORDER-TREE-WALK(x)
需要
Θ
(
n
)
\Theta(n)
Θ(n) 时间。
INORDER-TREE-WALK(x)
{
if (x != NIL){
INORDER-TREE-WALK(x->left);
cout << x->key;
INORDER-TREE-WALK(x->right);
}
}
查询
递归版本
TREE-SEARCH(x, k)
{
if (x == NIL || k == x->key)
{
return x;
}
if (k < x->key)
{
return TREE-SEARCH(x->left, k);
}else{
return TREE-SEARCH(x->right, k);
}
}
我们可以采用while循环来展开递归,用一种迭代方式重写这个过程。对于大多数计算机,迭代版本的效率要高得多。
递归版本
ITERATIVE-TREE-SEARCH(x, k)
{
while (x != NIL && k !- x->key)
{
if (k < x->key)
{
x = x->left;
}else{
x = x->right;
}
}
return x;
}
最大关键字元素和最小关键字元素
TREE-MINIMUM(x)
{
while (x->left != NIL)
{
x = x->left;
}
return x;
}
TREE-MINIMUM(x)
{
while (x->right != NIL)
{
x = x->right;
}
return x;
}
后继和前驱
TREE-SUCCESSOR(x)
{
if(x->right != NIL)
{
return MINIMUM(x->right);
}
y = x->parent;
while (y != NIL && x == y->right)
{
x = y;
y = x->parent;
}
return y;
}
TREE-PREDECESSOR(x)
{
if (x->left != NIL)
{
return MAXIMUM(x->left);
}
y = x->parent;
while (y != NIL && x = y->left)
{
x = y;
y = x->parent;
}
return y;
}
在一颗高度为h的二叉搜索树上,动态集合的操作SEARCH(搜索)、MINIMUM(最小值)、MAXIMUM(最高分)、PREDECESSOR(先驱)、SUCCESSOR(后继)、INSERT(插入)和DELETE(删除)可以在 O ( h ) O(h) O(h) 时间内完成
12.3 插入和删除
插入
TREE-INSERT(root, z)
{
y = NIL;
x = root;
while (x != NIL)
{
y = x;
if (z->key < x->key)
{
x = x->left;
}else{
x = x->right;
}
}
z->parent = y;
if (y == NIL)
{
root = z;
}else if (z->key < y->key){
y->left = z;
}else{
y->right = z;
}
}
删除
TRANSPLANT(root, u, v)
{
if (u->parent = NIL)
{
root = v;
}else if (u == u->parent->left){
u->parent->left = v;
}else{
u->parent->right = v;
}
if (v != NIL){
v->parent = u->parent;
}
}
TREE-DELETE(root, z)
{
if (z->left == NIL)
{
TRANSPLANT(root, z, z->right);
}else if (z->right == NIL)
{
TRANSPLANT(root, z, z->left);
}else{
y = TREE-MINIMUM(x);
if (y->parent != z){
TRANSPLANT(root, y, y->right);
y->right = z->right;
z->right->parent = y;
}
TRANSPLANT(root, z, y);
y->left = z->left;
z->left->parent = y;
}
}
12.4 随机构建二叉搜索树
一棵有n个不同关键字的随机构建二叉搜索树的期望高度为 O ( lg n ) O(\lg{n}) O(lgn)。
卫星数据是指一条记录中除了关键字key以外的其他数据。因为一个记录可能包含多个数据项,但是一般的排序算法只关心key,其他的项都是跟着key走,像“卫星”一样。另外,也可参考《算法导论》(中文第3版)第81页,也即书中“第二部分”的序言中所涉及到的卫星数据的相关说法。 ↩︎