KMP算法

令给定文本是一个长度为n的字符串S,模板是一个长度为m的字符串P,且m<=n。

  • 假设现在文本串S匹配到i位置,模式串P匹配到j位置,

      1:如果j=-1,或者当前字符匹配失败(即s[i]==p[j]),都令i++,j++,继续匹配下一个字符;

      2:如果j!=-1,且当前字符匹配失败(即s[i]!=p[j]),则令i不变,j=next[j]。意思是失配时,模式串P相对于文本串S向右移动了j-next[j]位。

           ( 也就是在匹配失败时,模式穿向右移动的位数为:失配字符所在位置-失配字符所在位置的next值,即上文所述j-next[j]。)  

  • next数组表达的含义就是:当前字符之前的字符串中,有多大长度的相同前缀后缀。即next[j]=k,代表j之前的字符串中有最大长度为k的相同前缀后缀。也意味着在某个字符失配时,该字符对应的next 值会告诉你在下一步匹配中,模式串应该跳到哪个位置(跳到next [j] 的位置)。如果next [j] 等于0或-1,则跳到模式串的开头字符,若next [j] = k 且 k > 0,代表下次匹配跳到j 之前的某个字符,而不是跳到开头,且具体跳过了k 个字符。
    • 寻找最长相同前缀后缀:
            模式串的各个子串             前缀           后缀         最大公共元素长度
      A0
      ABAB0
      ABCA,ABC,BC0
      ABCDA,AB,ABCD,CD,BCD0
      ABCDAA,AB,ABC,ABCDA,DA,CDA,BCDA1
      ABCDABA,AB,ABC,ABCD,ABCDAB,AB,DAB,CDAB,BCDAB2
      ABCDABDA,AB,ABC,ABCD,ABCDA,ABCDABD,BD,ABD,DABD,CDABD,BCDABD

      0

接下来就是相关核心代码!!!

//递推得next数组
void GetNext(char* p,int next[])
{
    int plen = strlen(p);
    next[0] = -1;
    int k = -1;
    int j = 0;
    while(j < plen - 1)
    {
        //p[k]表示前缀,p[j]表示后缀
        if(k == -1||p[j] == p[k])
        {
            ++k;
            ++j;
            next[j] = k;
        }
        else
        {
            k = next[k];
        }
    }
}

 

!!!KMP标程

int KmpSearch(char* s,char* p)
{
    int i = 0;
    int j = 0;
    int slen = strlen(s);
    int plen = strlen(p);
    while(i < slen && j < plen)
    {
        //如果j=-1,或者当前字符匹配成功(即s[i]==p[j]),都令i++,j++
        if(j == -1 || s[i] == p[j])
        {
            i++;
            j++;
        }
        else
        {
            //如果j!=-1,且当前字符匹配失败(即s[i]!=p[j],则令i不变,j=j[next]
            //next[j]即为j所对应的next值
            j = next[j];
        }
    }
    if(j == plen)
        return i - j;
    else
        return -1;
}

注:  我写的是缩减版

         详情看  原作者:July  博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值