KMP中next数组的理解与应用

理解

一、next数组的含义

next[i] 代表的是 i 位之前的字符串(不包括 i 位)的最长公共前缀和后缀的长度
例如:字符串P:ABCABCABCAB

i01234567891011
PABCABCABCAB
next-100012345678

next数组的获得:

// pl 字符串 P 的长度
void get_nxt(int pl)
{
    int i,j;
    i = 0;
    j = nxt[0] = -1;
    while(i<pl){
        if(j==-1||p[i]==p[j]){
            i++,j++;
            nxt[i] = j;
        }
        else
            j = nxt[j];
    }
}
二、next数组的用途

1、求解一个字符串的最长公共前缀、后缀以及中缀的长度:
这里的前中后缀在字符串中不会有重合的位置
比如:
ABCABCABC:3
AAA:1
AAAAAA:2

我们通过next数组已经得到最长的公共前后缀长度 p,只需要再在中间找一下存不存在长度为 p 的next值,即可。

void kmp(int lp)
{
    get_nxt(lp);
    for(int i=nxt[lp];i;i=nxt[i]){
    //应该是[i,lp-i]找寻
    //但是[i,2i)之间一定不会存在next值为i的点,所以就[2i,lp-i]
        for(int j=i*2;j<=lp-i;j++){	
            if(nxt[j]==i){
                printf("%d\n",i);
                return ;
            }
        }
    }
    printf("0\n");
}

2、周期性字符串
如果一个长度为 ls 的字符串是周期性字符串,那么

next[ls]!=0&&ls%(ls-next[ls])==0
循环节长度是:ls-next[ls]

例如:字符串 ABCABCABCABC,循环节长度:3

PABCABCABCABC
next-1000123456789

ls = 12,next[ls] = 9

还有一个规律就是:next数组往前跳的步长是一样的,除了最后一步。即 i-next[i] 保持恒定。
A B C A B C A B C A B C − > A B C A B C A B C − > A B C A B C − > A B C ABCABCABCABC ->ABCABCABC->ABCABC->ABC ABCABCABCABC>ABCABCABC>ABCABC>ABC
其实步数就是循环节的长度。

例题1:Theme Section
题意:每一首歌都是EAEBE这样的类型,其中A和B可以没有,就是让你找出来E的最大长度

我们可以先通过kmp求出他的next数组
这样前缀和后缀的E就已经满足了,只需要在中间找到next[i]也等于next[len]

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cmath>
#include<cstring>
#include<map>
#include<queue>
#include<utility>
#include<set>
#include<stack>
#include<string>
#include<vector>
#define ll long long
#define llu unsigned long long
using namespace std;
const int maxn = 1000010;
char p[maxn];
int nxt[maxn];
void get_nxt(int pl)
{
    int i,j;
    i = 0;
    j = nxt[0] = -1;
    while(i<pl){
        if(j==-1||p[i]==p[j]){
            i++,j++;
            nxt[i] = j;
        }
        else
            j = nxt[j];
    }
}
void kmp(int lp)
{
    get_nxt(lp);
    for(int i=nxt[lp];i;i = nxt[i]){
        for(int j=i*2;j<=lp-i;j++){
            if(nxt[j]==i){
                printf("%d\n",i);
                return ;
            }
        }
    }
    printf("0\n");
}
int main(void)
{
    int lp,n;
    scanf("%d",&n);
    while(n--){
        scanf("%s",p);
        lp = strlen(p);
        kmp(lp);
    }
    return 0;
}

例题2:Power Strings
给出一个字符串,求出该字符串是由几个最小循环节组成的。

#include<cstdio>
#include<cmath>
#include<cstring>
#include<algorithm>
#include<vector>
#include<map>
#include<queue>
#include<utility>
#include<iostream>

using namespace std;
const int maxn = 1000010;
char s[maxn];
int nxt[maxn];
void getnxt(int ls)
{
    int i=0;
    int j = nxt[0] = -1;
    while(i<ls&&j<ls){
        if(j==-1||s[i]==s[j]){
            i++,j++;
            nxt[i] = j;
        }
        else j = nxt[j];
    }
}
int main(void)
{
    while(~scanf("%s",s)){
        if(s[0]=='.')   break;
        int ls = strlen(s);
        getnxt(ls);
        if(nxt[ls]&&ls%(ls-nxt[ls])==0) printf("%d\n",ls/(ls-nxt[ls]));
        else    printf("1\n");
    }
    return 0;
}

例题3:Count the string
求所有非空前缀出现的次数和,
思路:由于next数组回退得到的前缀也是主串的后缀,所以所有next回退的次数加上本身的一次取模就是答案。

#include<iostream>
#include<cstdio>
#include<cstring>

using namespace std;
const int maxn = 200010;
const int mod = 10007;
int nxt[maxn];
char s[maxn];
void getnxt(int ls)
{
    int i=0;
    int j = nxt[0] = -1;
    while(i<ls&&j<ls){
        if(j==-1||s[i]==s[j]){
            i++,j++;
            nxt[i] = j;
        }
        else    j = nxt[j];
    }
}
int main(void)
{
    int T,ls;
    cin>>T;
    while(T--){
        scanf("%d%s",&ls,s);
        getnxt(ls);
        int ans = ls;
        for(int i=ls;i>=0;i--){
            int p = nxt[i];
            while(p>0){
                ans = (ans+1)%mod;
                p = nxt[p];
            }
        }
        printf("%d\n",ans);
    }
    return 0;
}

例题4:Cyclic Nacklace
问至少添加多少个字符,使得这个字符串有至少两个循环节。
若本身有两个循环节返回0,否则补充至两个循环节。

#include<iostream>
#include<cstdio>
#include<cstring>

using namespace std;
const int maxn = 200010;
int nxt[maxn];
char s[maxn];
void getnxt(int ls)
{
    int i=0;
    int j = nxt[0] = -1;
    while(i<ls&&j<ls){
        if(j==-1||s[i]==s[j]){
            i++,j++;
            nxt[i] = j;
        }
        else    j = nxt[j];
    }
}
int main(void)
{
    int T,ls;
    cin>>T;
    while(T--){
        scanf("%s",s);
        ls = strlen(s);
        getnxt(ls);
        int p = ls-nxt[ls];
        if(nxt[ls]!=0&&ls%p==0) printf("0\n");
        else    printf("%d\n",p-nxt[ls]%p);
    }
    return 0;
}

参考链接:https://www.cnblogs.com/lfri/p/10341479.html

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

逃夭丶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值