算法笔记--KMP模式匹配算法

看完数据结构,串这一章之后,对其中的kmp算法,感觉总是模凌两可的感觉,有一种将要入门却不知道该脉哪只脚的感觉,想把自己的理解写出来,求大佬们指点一下。

下面所提到的字符串都是基于如下的字符串定义:

#define MAXSIZE 15
struct String{
    char data[MAXSIZE];
    int length;
}a = {"goodgoogle",10},b ={ "google",6};

字符串数组从0开始存储字符。

朴素模式匹配算法

算法思路:
1.设置两个指针i,j,分别指向主串S和模式串T。
2.依次比较S[i]与T[j],如果S[i] = T[j],则分别++i,++j。
3.如果S[i] != T[j],那么i始终返回到S最先开始匹配的位置的下一个元素,j始终返回0;
4.直到 j > T.length,返回 i - j.
代码如下:

int index(string s,string t,int pos){
    int i = pos;//表示主串s起始位置
    int j = 0; //子串t的起始位置
    while(s[i] != '\0' && t[j] != '\0'){
        if(s[i] == t[j]){//如果相等就向后移一位
            ++i;
            ++j;
        }
        else {
            i = i- j + 1 ;//如果第一位是存储的字符长度,就是i=i-j+2
            j = 0;
        }
        if(t[j] == '\0')
            return i-j;
    }
    return 0;
}

但是这个算法有一个缺点,如果失配元素的位置在T的末尾的话,就会造成很多次多余的匹配。而kmp算法就是为了解决这一问题的。

kmp算法

核心思路:
1.用一个next数组来存放当前元素失配的情况下,前缀后缀最大共同字符数,next[j].
例如:
在这里插入图片描述
T串在D之前,next[j] = next[6] = 2.
2.为了避免朴素匹配算法重复匹配的缺点,提出不再移动主串S的指针i,只移动子串T,使 j = next[j]。
3.在求前缀后缀最大共同字符数next[j]的时候,也可以看做是一次匹配的过程,也就是前缀和后缀匹配的过程,前缀作为主串,后缀作为子串,去找最长共同元素串。
代码如下

void Getnext(int next[],String t)
{
    int j=0;//当前元素的下标,后缀单个字符的下标
    int k=-1;//当前元素之前有多少个相同元素,同时也做前缀单个字符的下标
    next[0]=-1;//特殊标记
    while(j<t.length-1)
    {
        if(k == -1 || t.data[j] == t.data[k])
        {
            j++;
            k++;
            next[j] = k;
        }
        else
            k = next[k];//不等就重新匹配。
    }
}
int KMP(String s,String t,int pos)
{
    int next[MAXSIZE],i=pos,j=0;
    Getnext(next,t);
    while(i<s.length && j<t.length)
    {
        if(j==-1 || s.data[i]==t.data[j])
        {
            i++;
            j++;
        }
        else
            j=next[j];               //j回退。。。
    }
    if(j>=t.length)
        return (i-t.length);         //匹配成功,返回子串的位置
    else
        return (-1);                  //没找到
}

关于next数组的求法:在这里插入图片描述
设当前失配的元素下标为:j,next[j] = k;
也就是说
在这里插入图片描述
现在要求next【j+1】,实际上就是判断Pk等不等于Pj
如果Pk = Pj,那么next[j+1] = next[j]+1.
如果Pk != Pj,因为next数组的意义是子串中前缀后缀公共字符串最大数目,所以Pk!=Pj的时候,继续采取kmp算法的回退方法,将k = next[k],从而去找到一个最长的匹配字段,也就是去寻找一个P[next[k]] = P[j].

在这里插入图片描述
如果K = next[k],任然无法找到一个P[next[k]] = P[j],就递归的进行下去,直到找到一个P[next[k]] = P[j]。

其他需要注意的地方:
next数组的第一个元素,是作为一个标记符号,记为-1,因为子串第一个元素永远没有最长公共前缀后缀。
所以k和j有可能等于-1,在求next数组的函数与kmp的函数中,判断条件应该各自加上j = =-1, k==-1。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
ava实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),可运行高分资源 Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现的毕业设计&&课程设计(包含运行文档+数据库+前后端代码),Java实现
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。下面详细介绍C语言的基本概念和语法。 1. 变量和数据类型 在C语言中,变量用于存储数据,数据类型用于定义变量的类型和范围。C语言支持多种数据类型,包括基本数据类型(如int、float、char等)和复合数据类型(如结构体、联合等)。 2. 运算符 C语言中常用的运算符包括算术运算符(如+、、、/等)、关系运算符(如==、!=、、=、<、<=等)、逻辑运算符(如&&、||、!等)。此外,还有位运算符(如&、|、^等)和指针运算符(如、等)。 3. 控制结构 C语言中常用的控制结构包括if语句、循环语句(如for、while等)和switch语句。通过这些控制结构,可以实现程序的分支、循环和多路选择等功能。 4. 函数 函数是C语言中用于封装代码的单元,可以实现代码的复用和模块化。C语言中定义函数使用关键字“void”或返回值类型(如int、float等),并通过“{”和“}”括起来的代码块来实现函数的功能。 5. 指针 指针是C语言中用于存储变量地址的变量。通过指针,可以实现对内存的间接访问和修改。C语言中定义指针使用星号()符号,指向数组、字符串和结构体等数据结构时,还需要注意数组名和字符串常量的特殊性质。 6. 数组和字符串 数组是C语言中用于存储同类型数据的结构,可以通过索引访问和修改数组中的元素。字符串是C语言中用于存储文本数据的特殊类型,通常以字符串常量的形式出现,用双引号("...")括起来,末尾自动添加'\0'字符。 7. 结构体和联合 结构体和联合是C语言中用于存储不同类型数据的复合数据类型。结构体由多个成员组成,每个成员可以是不同的数据类型;联合由多个变量组成,它们共用同一块内存空间。通过结构体和联合,可以实现数据的封装和抽象。 8. 文件操作 C语言中通过文件操作函数(如fopen、fclose、fread、fwrite等)实现对文件的读写操作。文件操作函数通常返回文件指针,用于表示打开的文件。通过文件指针,可以进行文件的定位、读写等操作。 总之,C语言是一种功能强大、灵活高效的编程语言,广泛应用于各种领域。掌握C语言的基本语法和数据结构,可以为编程学习和实践打下坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值