以下是几种KMP类型题:
-
A.类型1:匹配子字符串在母串中第几个位置开始出现。
-
B.类型2:子串在母串中出现了几次(可以有重叠的)。
eg:子串:AZA
母串:AZAZAZA
ans = 3;
-
C.类型3:母串中最多有几个子串(不可以有重叠的)。
eg:母串:aaaaa
子串:aa
ans=2, 最多2个
-
D.类型4:求最小循环节有几个。
eg: aabaabaabaab
最小循环节:aab
循环:4次
-
E.类型5:当前最小循环节中字符串的个数(不可以补字符串)。
eg:aabaabaabaab,可分为
aa (字符串长度:2,最小循环节:a,次数:2),
aabaab (字符串长度:6,最小循环节:aab,次数:2),
aabaabaab (字符串长度:9,最小循环节:aab,次数:3),
aabaabaabaab (字符串长度:12,最小循环节:aab,次数:4)
-
F.类型6:需要再补几个字符能构成一个类似手链那样循环相同的。
eg:abca ->2
abcde->5
aaa->0
-
G.类型7:给出一字符串,找出由2个或2个以上相同的子字符串组成的前缀,输出前缀长度及其相同的子字符串数。
A,B类型
A .匹配子字符串在母串中第几个位置开始出现。
B .子串在母串中出现了几次(可以有重叠的)。
//计算可重叠模式串
#include<iostream>
using namespace std;
const int N=1e6+10;
int n,m,ne[N];
char s[N],p[N];//p为模式串,s为文本串
int main()
{
scanf("%d %s %d %s",&n,p+1,&m,s+1);
//i表示当前所求ne对应下标
//j表示最长前缀的末下标,并继承上个ne的值
for(int i=2,j=0;i<=n;i++)
{
while(j && p[i]!=p[j+1]) j=ne[j];
if(p[i]==p[j+1]) j++;
ne[i]=j;
}
//i遍历文本串
//j表示最长前缀的末下标,并继承上个ne的值
//作用:以模式串匹配文本串s[1]~s[m]
for(int i=1,j=0;i<=m;i++)
{
while(j && s[i]!=p[j+1]) j=ne[j];
if(s[i]==p[j+1]) j++;
if(j==n)
{
printf("%d ",i-n);
j=ne[j];//跳过无解阶段
}
}
return 0;
}
//输入:
3 aba
7 abababa
//输出:
0 2 4
C类型
母串中最多有几个子串(不可以有重叠的)。
//计算不可重叠模式串
......(同上)
if(j==n)
{
printf("%d ",i-n);
j=0;//重置模式串已匹配长度
}
......
//输入:
3 aba
7 abababa
//输出:
0 4
(D~F)最小循环节问题
D 求最小循环节有几个。
E 当前最小循环节中字符串的个数(不可以补字符串)。
F 需要再补几个字符能构成一个类似手链那样循环相同的。
#include<iostream>
#include<string.h>
#include<cstdio>
using namespace std;
const int N=1e6+10;
int ne[N];
char p[N];
int main()
{
int n,cnt=1;
while(scanf("%d",&n)!=EOF)
{
if(n==0) break;
scanf("%s",p+1);
for(int i=2,j=0;i<=n;i++)
{
while(j && p[i]!=p[j+1]) j=ne[j];
if(p[i]==p[j+1]) j++;
ne[i]=j;
}
printf("Test case #%d\n",cnt++);
for(int i=1;i<=n;i++)
{
int L=i-ne[i];
if(i%L==0 && i/L>=2)
{
printf("%d %d\n",i,i/L);
}
}
printf("\n");
}
return 0;
}
- 对 L 的一些说明
- 如果len可以被 L = len - next [ len ] 整除,则表明字符串S可以完全由循环节循环组成,循环次数T = len / L 。
- 比较特殊的,当L = len 时,整个字符串本身就是最短循环节,循环次数为T = 1。