KMP详解

首先,next数组是怎么得来的???

i 为指向字符串T的下标的变量, j 是指向以 i-1 位置为结束的字符的字符串的 相同的前后缀最长的 前缀的结束字符的下标。S代表主串,T代表模式串。

next数组实质上是,在 i 的位置之前的字符串的前缀(不包含本身)和后缀(不包含本身)的相同的字符的个数。

一、给next[0]赋值为-1,因为第一个字符之前没有任何的字符串,用-1来标志已经将 i 位置之前整个字符串比较完毕。

二、给next[1]赋值为0,因为在比较字符串的前缀和后缀的时候,不能比较字符串本身,所以,在只有一个字符的情况下,没有比的必要,直接为0。

三、进入循环:
1、若 T[i]==T[j] 的时候,将 ++j 填入 next[i] 的位置,之后 i++。
2、若 T[i]!=T[j] 并且 T[j]==-1 的时候,将next[i]=0的同时i++。
3、剩余的情况就是, T[i]!=T[j] 并且 T[j]!=-1 的时候,去寻找next[j]为下标的字符,比较是否与next[i]相等。

这里写图片描述

其次,KMP是怎么比较的呢???

一、若 S[i]==T[j] ,则 i++,j++。将主串与模式串的指向同时后移。

二、若 S[i]!=T[j] 并且 next[j]==-1 的时候,i++。与主串下一个的字符比较。这种情况代表将主串上的该字符与模式串的一个字符都不匹配。

三、若 S[i]!=T[j] 并且 next[j]!=-1 的时候,j=next[j]。将模式串向后移动 i-j 个位置,然后与主串进行比较。

#include<stdio.h>
#include<stdlib.h>
#include<string>

void getnext(char *T,int *next)
{
    next[0] = -1;
    next[1] = 0;
    int i = 2;
    int j = 0;
    while (i<strlen(T))
    {
        if (T[i-1] == T[j])//如果相等
            next[i++] = ++j;//为其赋值
        else if(next[j]==-1)//在前面这部分串没有与之匹配的,则赋值为0
            next[i++] = 0;
        else//若当前没有找到,则去当前next[j]的下标继续找
            j = next[j];
    }
}

int kmp(char *S,char *T)
{
    int *next = new int[strlen(T)];
    getnext(T,next);//获得next数组
    int i = 0;
    int j = 0;
    while (i<strlen(S)&&j<strlen(T))//分别小于他们的长度
    {
        if (S[i] == T[j])
        {
            i++;
            j++;
        }
        else if (next[j]==-1)
        {
            i++;
        }
        else
        {
            j = next[j];
        }
    }

    return j == strlen(T)?i-j:-1;
}

int main(void)
{
    char S[] = { "abababcababababababababac" };
    char T[] = { "abcabab" };
    printf("%d\n",kmp(S,T));
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值