【数据结构】第9章查找！ (二叉搜索树BST AVL树 B-(+)树字典树 HASH表)

最新推荐文章于 2022-06-24 10:49:19 发布

Bill_Utada

最新推荐文章于 2022-06-24 10:49:19 发布

阅读量2.3k

点赞数 3

分类专栏：算法与数据结构/ACM 文章标签：数据结构 c语言 hash 二叉树算法

本文链接：https://blog.csdn.net/Area_52/article/details/43732083

版权

算法与数据结构/ACM 专栏收录该内容

109 篇文章 0 订阅

订阅专栏

本文详细介绍了查找技术，包括静态查找表中的顺序表、有序表、静态树表和索引顺序表的查找。动态查找表中重点讲解了二叉排序树（BST）、平衡二叉树（AVL树）的插入、删除和查找过程，以及B-树的基本概念。此外，还探讨了哈希表的构造方法、处理冲突的策略及其查找分析。

摘要由CSDN通过智能技术生成

难产的笔记。。。本来打算用1天结果前前后后拖了5天

§9.1 静态查找表

9.1.1 顺序表的查找

各种扫自己脑补吧复杂度O(n)

9.1.2 有序表的查找

若表是单调的，则可以利用二分查找。复杂度O(logn)

9.1.3 静态树表的查找

见
http://blog.csdn.net/area_52/article/details/43795837

9.1.4 索引顺序表的查找

建立索引表查找

§9.2 动态查找表

动态查找表的特点是，表结构本身是在查找过程中动态生成的，即对于给定值key，若表中存在其关键字等于key的记录，则查找成功返回，否则插入关键字等于key的记录。

9.2.1 二叉排序树和平衡二叉树

①二叉排序树及其查找过程
二叉排序树(BST)或者是一棵空树；或者是具有下列性质的二叉树：
⑴若它的左子树不空，则左子树上所有节点的值均小于它的根结点的值
⑵若它的右子树不空，则右子树上所有节点的值均大于它的根结点的值
⑶它的左右子树也分别为二叉排序树
查找代码如下

/** 递归实现二叉搜索树的查找操作Find */
Position Find( ElementType X,BinTree BST)
{
    if(!BST) return NULL;//空树
    if(X > BST->Data) return Find(X,BST->Right);
    if(X < BST->Data) return Find(X,BST->Left);
    return BST;/**找到了*/
}

/** 迭代实现二叉搜索树的查找操作Find */
Position Find( ElementType X,BinTree BST)
{
    while(BST) {
        if(X > BST->Data) {
            BST = BST->Right;
        }else if(X < BST->Data) {
            BST = BST->Left;
        }else return BST;//找到了
    }
    return NULL;//查找失败
}

/** 递归找二叉搜索树元素最小值 */
Position FindMin( BinTree BST )
{
    if(!BST) return NULL;
    else if(!BST->Left)
        return BST;//如果没有左孩子就是最小值
    else return FindMin( BST->Left );//沿左分支继续查找
}

/** 迭代找二叉搜索树元素最大值 */
Position FindMax( BinTree BST )
{
    if( BST ) {
        while(BST->Right) BST = BST->Right;
    }
    return BST;
}

②二叉排序树的插入和删除
⑴BST中结点的插入
新插入的结点一定是一个新添加的叶子结点，并且是查找不成功时查找路径上访问的最后一个结点的左孩子或者右孩子。因此把查找算法改一下就可以了。

一个无序序列可以通过构造一棵二叉排序树而变成一个有序序列，构造树的过程即为对无序序列进行排序的过程。

⑶BST中结点的删除
分三种情况处理：
1.删除的是叶子结点，那么直接删除即可。
2.删除的结点只有左子树或右子树，那么直接删除然后把子树放到它父亲上即可。
3.删除的结点左子树和右子树均不空。有两种做法，一是左子树接上来，右子树放到左子树的最右边。二是用直接前驱(后继)代替它，然后删除它的直接前驱(后继)(具体见P230)
删除的代码如下

Status DeleteBST(BiTree &T, KeyType key)
{
    //若二叉排序树T中存在关键字等于key的数据元素时，
    //则删除该数据元素结点，并返回TRUE，否则返回FALSE
    if(!T) return FALSE;//不存在关键字等于key的数据元素
    if(EQ(key,T->data.key)) return Delete(T);//找到关键字等于key的数据元素
    else if(LT(key,T->data.key)) return DeleteBST(T->lchild,key);
    else return DeleteBST(T->rchild,key);
}
Status Delete(BiTree &p)
{
    //从二叉排序树中删除结点p，并重接它的左子树或右子树
    if(!p->rchild) {//右子树空则只需要重接它的左子树
        q = p;
        p = p->lchild;
        free(q);
    }else if(!p->lchild) {//只需重接它的右子树
        q = p;
        p = p->rchild;
        free(q);
    }else {//左右子树都不空
        q = p;
        s = p->lchild;
        while(s->rchild) {//转左，然后向右到尽头
            q = s;
            s = s->rchild;
        }
        p ->data = s ->data;//s指向被删除结点的前驱
        if(q != p) q ->rchild = s->lchild;//重接*q的右子树
        else q -> lchild = s -> lchild; //重接*q的左子树
        delete s;
    }
    return TRUE;
}

③二叉排序树的查找分析
对ASL的计算发现，如果二叉树趋于”平衡”，那么它的ASL就可以有效降低，效率提高。在某些情况下，尚需在构成二叉排序树的过程中进行”平衡化”处理，称为二叉平衡树。

④平衡二叉树(AVL树)
平衡二叉树又称AVL树。它或者是一棵空树，或者是具有下列性质的二叉树：它的左子树和右子树都是平衡二叉树，且左子树和右子树的深度之差的绝对值不超过1。
若将二叉树上结点的平衡因子BF定义为该结点的左子树的深度减去它的右子树的深度，则平衡二叉树上所有结点的平衡因子只可能是-1,0,1。只要二叉树上有一个结点的平衡因子的绝对值大于1，则该二叉树就是不平衡的。
n层的AVL树的最小结点数符合类斐波那契。
1层的AVL树最小需要1个结点，2层的AVL树最小需要2个结点，3层的至少需要4个结点，4层的最小需要7个结点…
以此类推n层的最少结点=(n-1)层最少结点+(n-2)层最少结点+1

在AVL树中，插入一个新结点很有可能意味着失去平衡。在这种情况下要找出失去平衡的最小树根结点的指针，然后再调整这个子树中有关结点之间的链接关系，使之成为新的平衡子树。当失去平衡的最小子树被调整为平衡子树后，原有其他所有不平衡子树无序调整，整个二叉排序树就又成为一颗平衡二叉树。
失去平衡的最小子树是指以离插入节点最近且平衡因子异常(绝对值>1)的结点作为根的子树。
假设用A来表示失去平衡最小子树的根结点，则调整该子树的操作无外乎有下面4种情况

⑴RR旋转
新的结点插在了A的右子树的右子树上(不管插在左还是插在右)，那么将A的右子树提上去当树根，原A的右子树的左子树插在A的右边。如图所示

⑵LL旋转
新的结点插在了A的左子树的左子树上(不管插在左还是插在右)，那么将A的左子树提上去当树根，原A的左子树的右子树拿到A的左子树上。如图所示

⑶RL旋转
新的结点插在了A的右子树的左子树上(不管插在左还是插在右)，此时的重点是要把A C D三个结点调平衡。D是三个结点中中间大的，所以D去做树根，A做左子树，C做右子树。剩下的结点按照大小顺序找到位置即可。

⑷LR旋转
新的结点插在了A的左子树的右子树上(不管插在左还是插在右)，此时的重点是要把A B D三个结点调平衡。D是三个结点中中间大的，所以D去做树根，B做左子树，A做右子树。剩下的结点按照大小顺序找到位置即可。

⑤平衡树查找的分析
查找的时间复杂度为O(logn)

9.2.2 B-树和B+树

B树待补充….
①B-树及其查找

②B-树查找分析

③B-树的插入和删除

④B+树

9.2.3 键树

键树又称数字查找树(DST)。它是一棵度>=2的树，树中的每个节点中不是包含一个或几个关键字，而是只含有组成关键字的符号。
例如，若关键字是数值，则结点中只包含一个数位；若关键字是单词，则结点中只包含一个字母字符。
这种书会给某种类型关键字的查找带来方便。
如图就是一棵键树，从根到叶子结点路径中结点的字符组成的字符串表示一个关键字。

我们约定，键树是有序树
键树有两种存储结构，从而产生了两种键树

①孩子兄弟表示法的双链树
每个分支结点包括3个域
symbol域存储关键字的一个字符。
first域存储指向第一棵子树根的指针。
next域存储指向右兄弟的指针。
同时，叶子结点的first域存储指向该关键字记录的指针。
节点结构
双链树的实现代码

#define MAXKEYLEN 16 //关键字的最大长度
typedef struct {
    char ch[MAXKEYLEN];//关键字
    int num;//关键字长度
}KeysType;//关键字类型
typedef enum {LEAF,BRANCH} NodeKind;//结点种类:{叶子,分支}
typedef struct DLTNode {
    char symbol;
    struct DLTNode *next;//指向兄弟结点的指针
    NodeKind kind;
    union {
        Record *infoptr;//叶子结点的记录指针
        struct DLTNode *first;//分支结点的孩子链指针
    };
}DLTNode, *DLTree;//双链树的类型

双链树的查找代码

Record *SearchDLTree(DLTree T,KeysType K)
{
    //在非空双链树T中查找关键字等于K的记录，若存在，则
    //返回指向该记录的指针，否则返回空指针
    p = T->first;
    i = 0;//初始化
    while(p && i < K.num) {
        while(p && p -> symbol != K.ch[i]) p = p->next;//查找关键字的第i位
        if(p && i < K.num-1) p = p->first;//准备查找下一位
        ++ i;
    }//查找结束
    if(!p) return NULL;//查找不成功
    else return p->infoptr;//查找成功
}//Search DLTree

键树中每个节点的最大度d和关键字的”基”有关，若关键字是单词，则d=27；若关键字是数值，则d=11。键树的深度h则取决于关键字中字符或数位的个数。

②多重链表表示的Trie树(字典树)
若以树的多重链表表示键树，则树的每个节点中应含有d个指针域，此时的键树又称Trie(读音同Try)树或前缀树。Trie树可以看做是确定有限状态的自动机。

如下图就是一个Trie树
Trie

Trie树的性质：
①根节点不包含字符，除根节点外每一个节点都只包含一个字符。
②从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
③每个节点的所有子节点包含的字符都不相同。

在Trie树上进行查找的过程为：
从根结点出发，沿和给定值相应的指针逐层向下，直至叶子结点，若叶子结点中的关键字和给定值相等，则查找成功，若分支结点中和给定值相应的指针为空，则查找不成功。
查找算法代码如下

typedef struct TrieNode {
    NodeKind kind;
    union {
        struct {KeysType K; Record *infoptr;}  lf;//叶子结点
        struct {TrieNode *ptr[27]; int num;}   bh;//分支结点
    };
}TrieNode, * TrieTree;
Record *SearchTrie(TrieTree T,KeysType K)
{
    //在字典树T中查找关键字等于K的记录
    for(p = T,i = 0;//对K的每个字符逐个查找
        p && p -> kind == BRANCH && i < K.num;//*p为分支结点
        p = p->bh.ptr[ord(K.ch[i])], ++i;);//ord求字符在字母表中序号
    if(p && p->kind == LEAF && p->lf.K == K) return p -> lf.infoptr;//查找成功
    else return NULL;//查找不成功
}//SearchTrie