kmp的next:
1 next数组含义:除去第i个数,在一个字符串里面从第一个到第(i-1)字符串的前缀与后缀最长重复的个数。
2 理解一下代码过程:(abacbaba为例)
”“,i==1,前面没有字符,没有前后缀,next为0
“a”,i==2,只有一个字母,没有前后缀,next为0(第1个数)
“ab”,i==3,前缀为“a”,后缀为“b”,前后缀相同长度为0,next为0(第2个数)
“aba”,i==4,前缀为“a”,后缀为“ba”,前后缀相同为1,next为1(第3个数和第1个数一样)
“abac”,i==5,前缀后缀没有相同,next为0(第4个数)
“abacb”,i==6,前缀后缀没有相同,next为0(第5个数)
“abacba”,i==7,前后缀相同为“a”,next为1(第6个数和第1个数一样)
“abacbab”,i==8,前后缀相同为“ab”,next为2(第7个数和第2个数一样)
“abacbaba”,i==9,前后缀相同为“aba”,next为3(第8个数和第3个数一样)
会发现遍历的数和上一次next值指的前缀位置数的关系,如果两个位置的数相同,就说明前缀和遍历到字符的后缀相同的数加一;如果不相同,回溯到该点和前缀相同的地方。
3 代码:
int get_next(char s[],int nexth[])
{
//next初始化都为0
int i=1;
nexth[0]=-1;//第0位没有字符
int j=-1;
while(i<s[0])//s[0]表示字符串的长度
{
if(j==-1||s[i]==s[j])
{
i++;
j++;
nexth[i]=j;
}
else
j=nexth[j];//回溯
}
return 0;
}
CodeForces - 126B :
题意:给出一个字符串,找出一个子串既是它的前缀,也是它的后缀,还是一个非后缀也非前缀的子串。
代码:
#include <algorithm>
#include <iostream>
#include <string>
#include <vector>
#include <stack>
#include <cstdlib>
#include <map>
#include <queue>
#include <cstdio>
#include <cstring>
#include <cmath>
#include <vector>
using namespace std;
const int maxn=1e6+5;
char s[maxn];
int len;
int nxt[maxn];
int h[maxn];
int get_next()
{
memset(nxt,0,sizeof(nxt));
int i=0;
nxt[0]=-1;
int j=-1;
while(i<len)
{
if(j==-1||s[i]==s[j])
{
i++;
j++;
nxt[i]=j;
}
else
j=nxt[j];//回溯
}
return 0;
}
int main()
{
while(~scanf("%s",s))
{
len=strlen(s);
get_next();
memset(h,0,sizeof(h));
for(int i=1; i<len; i++)//不包括len
{
h[nxt[i]]=1;//记录可以回溯到的点
}
int x=nxt[len];//不包含该位置对应的字符,所以不是len-1
while(!h[x]&&x)//循环到可以回溯,或者x==0且都还是不可回溯
{
x=nxt[x];
}
if(!x)
{
printf("Just a legend\n");
}
else
{
for(int i=0; i<x; i++)
{
printf("%c",s[i]);
}
printf("\n");
}
}
return 0;
}
kmp单模式串匹配:
讲讲暴力:暴力匹配其实就是,模式串和主串匹配的时候,每次不匹配就回溯到模式串的第一个字母处。
kmp:建立在模式串计算出的next值上,每次不匹配的时候,回溯到模式串上一个匹配上的字符结构重新对齐(也就是除去不匹配这个点,前面匹配的上一个相同字符结构处),该点对应的next值处。
代码:
int get_next(char s[],int nexth[])
{
//next初始化都为0
int i=1;
nexth[0]=-1;//第0位没有字符
int j=-1;
while(i<s[0])//s[0]表示字符串的长度
{
if(j==-1||s[i]==s[j])
{
i++;
j++;
nexth[i]=j;
}
else
j=nexth[j];//回溯
}
return 0;
}
int get_pos(char s[],char s1[],int nexth[])
{
int i=1;
int j=1;
while(i<=s[0]&&j<=s1[0])
{
if(j==-1||s[i]==s1[j])
{
i++;
j++;
}
else
j=nexth[j];
}
if(j>s1[0]) return i-s1[0];//返回匹配的第一个字母的位置
else return 0;
}