个人心得:说实话第一次接触kmp算法,确实是不太好理解,反正我是的,大神就比不了了。
kmp算法主要分两个部分实现:第一个部分,就是去求next数组的值;
第二个部分,就是两个字符串去匹配;
next数组是什么意思了,我个人认为就是当长度为j时,该字符串的前缀与后缀相等的长度;
例如:t[]="abcabc";
j=0,next[0]=-1;
j=1,字符串为"a",next[1]=0;
j=2,字符串为"ab",next[2]=0;
j=3,字符串为"abc",next[3]=0;
j=4,字符串为"abca",next[4]=1;
j=5,字符串为"abcab",next[5]=2;
最后当j==strlen(t),next[j]=3,表示该字符串前缀与后缀相等的最大长度;
实现代码:
<span style="font-size:18px;">void get_next(char t[],int next[])
{
int len=strlen(t);
int j=-1,i=0;
next[i]=j;
while(i<len)
{
if(j==-1||t[i]==t[j])
{
i++;
j++;
next[i]=j;
}
else
j=next[j];
}
}</span>
最后就是匹配了,有几种不同的要求
第一:求在s串中出现的位置
<span style="font-size:18px;">int kmp(char *s,char *t,int pos)
{
int i=pos;
int j=0;
int len1=strlen(s),len2=strlen(t);
while(i<len1&&j<len2)
{
if(j==-1||s[i]==t[j])
{
i++;
j++;
}
else
{
j=next[j];
}
}
if(j==len2)
return i-len2;
else
return -1;
}</span>
第二种:求周期
例如:ababab 周期为3;
因为我们已经说了:最后当j==strlen(t),next[j]=3,表示该字符串前缀与后缀相等的最大长度;
所以如果(len%(len-next[len])==0)就表明该字符串前缀与后缀相等的数量大于等于1
这里我们就只需要一个函数就可以了
<span style="font-size:18px;">#include <iostream>
#include<cstdio>
#include<cstring>
#define maxn 1000000+10
using namespace std;
char t[maxn];
int next[maxn];
void get_next(char t[],int next[])
{
int len=strlen(t);
int j=-1,i=0;
next[i]=j;
while(i<len)
{
if(j==-1||t[i]==t[j])
{
i++;
j++;
next[i]=j;
}
else
j=next[j];
}
}
int main()
{
while(~scanf("%s",t))
{
if(strcmp(t,".")==0)
break;
get_next(t,next);
int len=strlen(t);
if(len%(len-next[len])==0)
printf("%d\n",len/(len-next[len]));
else
printf("1\n");
}
return 0;
}</span>
第三种情况:
还是两个串s,t;
求s中有多少个t;
例如:
aaaaaa aa
3
这里只需要改下kmp算法,在找到一个后,不用立刻返回位置,而是一直找完。
<span style="font-size:18px;">int kmp(char *s,char *t,int pos,int *next)
{
int i=pos;
int j=0,cnt=0;
int len1=strlen(s),len2=strlen(t);
while(i<=len1)
{
if(j==-1||s[i]==t[j])
{
i++;
j++;
if(j==len2)
{
j=0;
cnt++;
}
}
else
j=next[j];
}
return cnt;
}</span>
暂时就是这么多了。