数据结构与算法复习5

不知地下宫阙

已于 2023-05-13 10:49:10 修改

阅读量119

点赞数

文章标签：数据结构算法散列表

于 2023-05-09 10:54:46 首次发布

本文链接：https://blog.csdn.net/bbchk/article/details/130569607

版权

本文介绍了查找算法的基本概念和几种主要类型，包括效率较低的顺序查找，高效的折半查找，适用于动态数据的分块查找，以及字符串匹配中的朴素算法和KMP算法。同时，详细讨论了散列查找，强调了散列函数的设计和冲突解决策略，如开放地址法和链表地址法。

摘要由CSDN通过智能技术生成

查找算法，主要是计算平均查找长度？

基本概念

查找是在给定的数据结构中搜索满足条件的结点。

查找也称为检索。

衡量一个查找算法好坏的依据主要是查找过程中需要执行的平均比较次数，或称为平均查找长度

顺序查找

简单且低效的算法

逐个将每个结点的关键码和待查的关键码值进行比较，直到找出相等的结点或者找遍了所有的结点。

执行顺序查找算法时，被查找的线性表可以是顺序存储或链接存储，对结点没有排序要求。

最好情况下，时间复杂度为O(1)

最坏情况下，时间复杂度为O(n)

一般每个结点都有相同的查找概率，此时顺序查找的平均长度为n/2,时间复杂性为O(n)

折半查找

折半查找，首先找到表的中间结点，将其关键码与给定的要查找的值进行比较，若相等，则查找成功；若大于要查找的值，则继续在表的前半部分折半查找，否则继续在表的后半部分进行折半查找。

对存储和排序的要求：顺序存储且结点排序

比较判断key中间值的大小，改变查找的范围

最好情况，只需比较一次就找到对应结点，时间复杂度为O(1);

最坏情况，找不到对应结点，需要logn次比较，时间复杂度为O(logn) ；

平均时间复杂度为O(logn)。

对比

分块查找

以每块最大关键码为值加入索引表，先比较索引表，找到块比较。

如果既要有较快的查找速度，又要满足元素动态变化的要求，可以采用分块查找算法。

分块查找将一个大的线性表划分成若干块(如何分块？)，块内不排序，块之间排序(假设非递减)。建立一个索引表，把每块中的最大关键码值作为索引表的关键码值，且非递减排序。

查找某结点时，先在索引表中顺序查找或者折半查找，找到该结点对应的块，然后在块内顺序查找

复杂性分析

分块查找的平均查找长度(比较次数)由对索引表的平均查找长度和对块的平均查找长度组成。设线性表有n个结点，等分成b块，每块有s=n/b个结点。假设对索引表和块都采用顺序查找，假定对每个结点的查找概率相同。则平均查找长度为b/2 + s/2 = (n/s+ s)/2 ，当s2 ＝n时取得最小值O(n0.5)

比较

字符串匹配

串

基本概念

串是字符的有限序列，也称字符串。串是一种线性表，每个结点的数据为一个字符。

串广泛应用于输入输出、文本编辑、信息搜索等。搜索引擎的核心技术是高效快速的串匹配算法

串中任意个连续的字符组成的子序列称为该串的子串。空串是任何串的子串。任意串都是其自身的子串。串S的子串中除了其自身外，都是S的真子串

顺序存储是串的最常用的存储方式。 C/C++中，每个字符占用一个字节，最后附加0x00表示字符串的结束。顺序存储的串在删除字符和插入字符的操作时，都要移动字符

串匹配问题，定义p[a:b]

朴素的串匹配算法

将P中的字符依次与T中的字符进行比较。设T=t[0:n-1], P=p[0:m-1], m<=n. 从T的最左端开始进行比较

朴素的串匹配算法每趟最多比较 m次，最多n-m+1趟，总的比较次数最多为m(n-m+1)，所以 时间复杂度为O(m×n)。

朴素的匹配算法效率低，实际的应用中很少采用

KMP匹配算法

KMP匹配算法是由Knuth,Morris和Pratt 提出的一种快速的串匹配算法。

KMP算法考虑: (1)当匹配失败时，应该将P右移多少个字符；(2)P右移后，应该从P中的哪个字符开始比较。

性质

计算next数组，直接上代码和题目

void getNext(char t[], int next[]){
    int i=0,j=-1;
    next[0]=-1;
    while(i<strlen(t))
    {
        while(j>=0&&t[i]!=t[j])
        {
            j=next[j];
        }
        i++;j++;
        if(t[i]==t[j])
            next[i]=next[j];
        else next[i]=j;
    }
}