二叉查找树BST----legend050709

最新推荐文章于 2023-05-10 19:24:09 发布

legend050709ComeON

最新推荐文章于 2023-05-10 19:24:09 发布

阅读量655

点赞数

分类专栏：数据结构与算法文章标签：二叉树

本文链接：https://blog.csdn.net/legend050709/article/details/38847183

版权

数据结构与算法专栏收录该内容

121 篇文章 0 订阅

订阅专栏

二叉排序、搜索树：BST

(一) 定义 & 特点

(二) 二叉查找数的查找

(三) 二叉查找数的遍历

(四)二叉查找树的插入与创建

(五)二叉查找树的删除

(六)支持重复数据的二叉查找树

(七)二叉查找树的复杂度

(八)二叉查找树和Hash表对比

(九)二叉查找树的其他操作

(十) 平衡二叉树AVL

-----------------------------------
（一）二叉查找树的概念以及类型定义，特点：

（1）定义
二叉查找树为空树，或者满足以下条件：
1.左子树非空，则左子树上所有记录均小于根节点的记录；
2.右子树非空，则右子树上所有记录均大于根节点的记录；
3.左右子树又是一棵二叉查找树。

（2）类型定义：
typedef struct node{
DataType data;
node* lchild, * rchild;
}BSTNode;

（3）特点：
中序遍历二叉查找树，得到一个递增的有序序列；

（二）二叉查找树的查找
（1）递归：

BSTNode* bstSearch(BSTNode* root, DataType k){
if(root==NULL)
return NULL;
if(root->data==k)
return root;
else if(k<root->data) //在左子树中查找
return bstSearch(root->lchild,k);
else if(k>root->data)//在右子树中查找
return bstSearch(root->rchild,k);
}
（2）非递归：

/*
在以root为根节点的二叉排序树中查值为x的节点，father保存的是所查节的父节点；
father为引用型参数
*/

BSTNode* bstSearch(BSTNode* root ,DataType x, BSTNode* & father)
{
BSTNode* pnode=root;
father=NULL;

while(pnode!=NULL && x!=pnode->data){
father=pnode;
if(x<pnode->data)
pnode=pnode->lchild;
else
pnode=pnode->rchild;
}//没有找到,循环结束则pnode==NULL，father为值很接近data的叶子节点；
return pnode;
}

（三）二叉查找树的遍历：
略
（四）二叉查找树的插入与创建：

（1）插入：
注意：新节点都是作为叶子节点插入的，所以树是向下生长的。

/*
目的：在以root为根节点的二叉排序树中插入一个值为x的节点，插入成功返回1，否则0；
注意：root为引用型参数；
思想：若原二叉查找树为空，则直接插入节点作为根节点；
若x小于根节点的data，则插在左子树中，否则右子树中。
*/
int bstInsert(BSTNode* & root, DataType x){
if(NULL==root) {
  root=(BSTNode* )malloc(sizeof(BSTNode));
  root->data=x;
  root->lchild=root->lchild=NULL;
  return 1;
}
else if(root->data == x) {//如果二叉查找树中已经存在值为x的节点，则失败。
   return 0;
}

else if(x<root->data) {//插入到左子树中。
return bstInsert(root->lchild,x);
}
else
bstInsert(root->rchild,x);
}

或者：非递归方法：

int bstInsert(BSTNode* & root,DataType x){
BSTNode* pnode,*newNode,*father;
pnode=bstSearch(root,x,father);
//调用上面的非递归的查找
//如果找到则pnode非空，没有找到则pnode为空，father为值很接近x的叶子节点。

if(pnode!=NULL )//已经存在值为x的节点
return 0；

newNode=(BSTNode* )malloc(sizeof(BSTNode));
newNode->data=x;
newNode->lchild=newNode->rchild=NULL;

if(NULL==father) //如果原二叉查找树为空
root=newNode;

else if(x<father->data)
father->lchild=newNode;
else
father->rchild=newNode;
return 1;
}

（2）二叉查找树的构造：

void createBST(BSTNode* & root ,DataType[] dataArray, int length)

{
root=NULL;
for(int i=0;i<length;i++)
bstInsert(root,dataArray[i]);
}
（五）二叉查找树的删除：

二叉查找树中删除一个节点，不能把以该节点为根的子树都删除，删除二叉查找树的一个节点就相当于删除有序序列中的一个元素。

设：被删除的节点为pnode,father为其父节点，分为四种情况：
（1）pnode为叶子节点：
直接删除pnode.
（2）pnode为左单分支节点：
pnode只有左子树，而没有右子树。
将pnode的左子树直接代替pnode。
（3）pnode为右单分支节点：
将pnode的右子树直接代替pnode。
（4）pnode为双分支节点：
1）方法一：
将pnode的左子树的最右节点与pnode交换，（pnode的左子树的最右节点没有右孩子），采用情况2删除左子树的最右节点。
2）方法二：
将pnode的右子树的最左节点与pnode交换，（pnode的右子树的最左节点没有左孩子），采用情况3删除右子树的最左节点。
代码实现：
/*
目的：在以root为根节点的二叉查找树中删除值为x的节点，成功则返回1，否则返回0；
注意：root为引用型参数，因为root也可能被删除。
*/

int bstDelete(BSTNode* &root , DataType x ){
BSTNode* father,*node_x;

node_x=bstSearch(root,x,father); //调用上面的非递归的search
if(node_x==NULL)
return 0;//没有该节点。

BSTNode* temp_nodeX=node_x; //保存node_x的值；
if(NULL==node_x->rchild) //右孩子为空，为左单分支节点
{
node_x=node_x->lchild;
}

else if(NULL==node_x->lchild) //左孩子为空，为右单分支节点
{
node_x=node_x->rchild;
delete temp_nodeX;
return 1;
}

else { //node_x为双分支节点
  BSTNode* pnode=node_x->lchild;
  father=node_x;
  //寻找node_x的左子树的最右节点，father为其父节点；
  while(pnode->rchild!=NULL)
  {
  father=pnode;
  pnode=pnode->rchild;
  }

  node_x->data=pnode->data;//将node_x的左子树的最右节点的值保存在node_x中
  //删除node_x的左子树的最右节点
  if(father==node_x)
    father->lchild=pnode->lchild;
  else
    father->rchild=pnode->lchild;

delete pnode;
return 1;
}

}

------

(六) 支持重复数据的二叉查找树

前面讲二叉查找树的时候，我们默认树中节点存储的都是数字。很多时候，在实际的软件开发中，我们在二叉查找树中存储的是一个包含很多字段的对象。我们利用对象的某个字段作为键值（key）来构建二叉查找树。

前面我们讲的二叉查找树的操作，针对的都是不存在键值相同的情况。那如果存储的两个对象键值相同，这种情况该怎么处理呢？这里有两种解决方法。

重复数据的二叉查找数的处理方法：

(6.1)二叉查找树的每个节点为数组或者链表：

二叉查找树中每一个节点不仅会存储一个数据，因此我们通过链表和支持动态扩容的数组等数据结构，把值相同的数据存储在同一个节点上。

(6.2)树中存在和要插入数据key相同的数据时，将这个要插入的数据放到这个节点的右子树中；

所以：当要查找、删除数据时，遇到值相同的节点，并不能停止查找，而是继续在右子树中查找，直到遇到叶子节点。

------

（七）二叉查找树的复杂度

最糟糕的情况, 当二叉查找树根节点的左右子树极度不平衡时，就退化成了链表，所以查找时间复杂度就变成了 O(n)。

最理想的情况，二叉查找树是一棵完全二叉树，这个时候插入、删除、查找的时间复杂度是 O(height)，差不多O(lgn)。

显然，极度不平衡的二叉查找树，它的查找性能肯定不能满足我们的需求。我们需要构建一种不管怎么删除、插入数据，在任何时候，都能保持任意节点左右子树都比较平衡的二叉查找树，这就是我们下一节课要详细讲的，一种特殊的二叉查找树，平衡二叉查找树。平衡二叉查找树的高度接近 logn，所以插入、删除、查找操作的时间复杂度也比较稳定，是 O(logn)。

-----

（八）二叉查找树和Hash表对比

散列表那节中讲过，散列表的插入、删除、查找操作的时间复杂度可以做到常量级的 O(1)，非常高效。

而二叉查找树在比较平衡的情况下，插入、删除、查找操作时间复杂度才是 O(logn)，相对散列表，好像并没有什么优势，那我们为什么还要用二叉查找树呢？我认为有下面几个原因：

(1)数据有序性

散列表中的数据是无序存储的，如果要输出有序的数据，需要先进行排序。而对于二叉查找树来说，我们只需要中序遍历，就可以在 O(n) 的时间复杂度内，输出有序的数据序列。

(2)性能稳定性

散列表扩容耗时很多，而且当遇到散列冲突时，性能不稳定，尽管二叉查找树的性能不稳定，但是在工程中，我们最常用的平衡二叉查找树的性能非常稳定，时间复杂度稳定在 O(logn)。

所以：

散列表的构造比二叉查找树要复杂，需要考虑的东西很多。比如散列函数的设计、冲突解决办法、扩容、缩容等。平衡二叉查找树只需要考虑平衡性这一个问题，而且这个问题的解决方案比较成熟、固定。

综合这几点，平衡二叉查找树在某些方面还是优于散列表的，所以，这两者的存在并不冲突。我们在实际的开发过程中，需要结合具体的需求来选择使用哪一个。

------