KMP算法主串不回溯。
用next[j]表示T[j]对应的k值(0≤j<m),定义:
当j=0时 next[j]=-1;
当集合非空时 max{k|1≤k<j且T[0]···T[k-1]=T[j-k]···T[j-1]} ;
当其他情况时 next[j]=0。
next[j]的算法分析:
k=next[j-1](由next[]的 定义可以知道:t0t1…tk-1= tj-k…tj-3tj-2)
1.如果t[k]==t[j-1]或k= =-1(不存在长度相同的前缀子串和左子串 )
则t0t1…tk-1tk= tj-k…tj-3tj-2tj-1,因此next[j]=k+1,next[j]计算结束
否则, 查找t0t1…tk的最长左子串
k=next[k],转 1 继续执行
//next的求解算法
void Compute_Next(char t[], int next[])
{
int j=2,k;
next[0]=-1;j=1;
while(t[j]!='\0'){
k=next[j-1];
while((k!=-1)&&(t[k]!=t[j-1]))
k=next[k];
next[j]=++k;
j++;
}
}
伪代码:
输入:主串S,模式T,模式T的next值。
1.在串S和串T中分别设比较的起始下标i和j;
2. 循环直到S中所剩字符长度小于T的长度或T中所有字符均比较完毕
2.1 如果S[i]==T[j],继续比较S和T的下一个字符;
2.2否则, 将j向右滑动到next[j]位置,即j=next[j];
2.3 如果j=-1,则将i和j分别加1,准备下一趟比较;
3. 如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回0;
代码实现:
int KMP_FindPat(char* s,char* t,int* next){
int i=0;//主串S的起始下标
int j=0;//子串的起始下标
while(s[i]!='\0'&&t[j]!='\0'){
if(j==-1||s[i]==t[j]){//其中一个字符匹配成功
i++;//下标后移
j++;//下标后移
}
else
j=next[j];//将j向右滑动到next[j]位置
}
if(t[j]=='\0')//匹配成功
return i-j;
else//匹配失败
return 0;
}