一、二叉排序树的定义
二叉排序树(BST),也叫二叉查找树。二叉排序树或者是一颗空树,或者是一颗具有下列特性的非空二叉树:
1.若左子树非空,则左子树上所有结点关键字值均小于根结点的关键字值;
2.若右子树非空,则右子树上所有结点关键字值均大于根结点的关键字值;
3.左、右子树本身也分别是一颗二叉排序树。
二叉排序树也是个递归的数据结构,如下图所示
根据定义,可知左子树结点值<根结点值<右子树结点值,所以对二叉排序树进行中序遍历,可以得到一个递增的有序序列。如上图二叉排序树中序遍历序列为123468。
二、二叉排序树的查找
因为二叉排序树有序,所以查找思想比较简单,从根结点开始查找,若树非空,将给定值与根结点关键字值比较,若相等,则查找成功;若不等且给定值小于根结点关键字值,在根结点左子树中查找;否则在根结点的右子树查找。
显然递归实现比较简单,但是递归效率太低了,在这里我们常使用非递归的方式。
二叉排序树的非递归查找算法:
BSTNode *BST_Search(BiTree T,ElemType key,BSTNode *&p)
{
//查找函数返回指向关键字值为key的结点指针,若不存在,返回NULL
p=NULL; //p指向被查找结点的双亲,用于插入和删除操作中
while(T!=NULL&&key!=T->data)
{
p=T;
if(key<T->data)
T=T->lchild; //进入左子树
else
T=T->rchild; //进入右子树
}
return T;
}
三、二叉排序树的插入
先从二叉排序树的插入说起,因为二叉排序树作为一种动态集合,其特点是树的结构通常不是一次生成的,而是查找过程中,当树中不存在关键字值等于给定值的结点时再进行插入的。所以二叉排序树的构造其实就是个二叉排序树插入的过程。
二叉排序树插入思想和查询思想很接近:若原二叉排序树为空,则直接插入结点;否则,若关键字k小于根结点关键字,则插入左子树;否则插入右子树。
算法描述如下:
int BST_Insert(BiTree &T,KeyType k)
{
//在二叉排序树T中插入一个关键字为k的结点
if(T==NULL) //原树为空,新插入的记录为根结点
{
T=(BiTree)malloc(sizeof(BSTNode));
T->key=k;
T->lchild=T->rchild=NULL;
return 1; //返回1,表示成功
}
else if(k==T->key) //树中存在相同关键字的结点
return 0;
else if(k<T->key) //插入T的左子树
return BST_Insert(T->lchild,k);
else //插入T的右子树
return BST_Insert(T->rchild,k);
}
由此可见,插入的新结点一定是某个叶结点,如下图所示,先后插入28和58,虚线表示的边是其查找的路径。
四、二叉排序树的构造
构造一棵二叉排序树就是依次输入数据元素,并将它们插入二叉排序树中适当位置上的过程。具体过程是,每读入一个元素,就建立一个新结点,若二叉排序树非空,则将新结点的值与根结点的值比较,若小于根结点的值,则插入左子树;否则插入右子树;若二叉排序树为空,则将新结点作为二叉排序树的根结点。
算法描述如下:
void Creat_BST(BiTree &T,KeyType str[],int n)
{
//用关键字数组str[]建立一个二叉排序树
T=NULL; //初始时bt为空树
int i=0;
while(i<n) //依次将每个元素插入
{
BST_Insert(T,str[i]);
i++;
}
}
五、二叉排序树的删除
在二叉排序树中删除一个结点时,不能把以该结点以根为子树上的结点都删除,必须先把被删除结点从存储二叉排序树的链表上摘下,将因删除结点而断开的二叉链表重新链接起来,同时确保二叉树排序树的性质不会丢失。
删除操作的实现过程按3种情况来处理:
(1)若被删除结点z是叶结点,则直接删除,不会破坏二叉排序树的性质;
(2)若结点z只有一棵左子树或右子树,则让z的子树成为z父节点的子树,替代z的位置。
(3)若结点z有左、右两棵子树,则令z的直接后继(或直接前驱)替代z,然后从二叉排序树中删除这个直接后继(或直接前驱),这样就转换成为了第一或第二种情况。
下图显示删除45、78、78的过程:
六、二叉排序树的查找效率分析
对于高度为h的二叉排序树,其插入和删除操作的运行时间都是O(h)。但在最坏情况下,即构造二叉排序树的输入序列是有序的,那么就会形成一个倾斜的单支树,此时二叉排序树的性能显著变坏,树的高度也增加为元素个数n,如下图所示:
(a)的平均查找长度为2.9,(b)的平均查找长度为5.5。可知二叉排序树查找算法的平均查找长度,主要取决于树的高度,即与二叉树的形态有关。
若二叉排序树是一个只有(右)左孩子的单支树(类似于单链表),则其平均查找长度和单链表相同,为O(n)。若二叉排序树的左、右子树的高度之差的绝对值不超过1,则这样的二叉排序树称为平衡二叉树,它的平均查找长度达到。