串的模式匹配2--Knuth-Morris-Pratt算法(kmp算法)
算法描述:
(1) 关于next数组的实现算法:
void GetNext(String s,int next[ ])
{
int j,k;
j=0;k=-1;
next[0]=-1;
while(每个字符的前的串中进行遍历)
{
if(当k下标回到t串首字符前或是t,data[k]==t.data[j]连续成立)
{j++;k++;next[j]=k;}
else{k=next[k];回退}
}
}
(2) 改进后,关于nextval数组的实现算法:
voidGetNextval(SqString t,int nextval[]) //由模式串t求出nextval值
{
int j=0,k=-1;
nextval[0]=-1;
while(j<t.length与原先相比遍历长度加1)
{
if(k==-1 || t.data[j]==t.data[k])
{
j++;k++;
if (t.data[j]!=t.data[k] 共同前进一位后比较不相同)
nextval[j]=k;
else
nextval[j]=nextval[k];把前一个nextval值赋给next[j]
}
else k=nextval[k];
}
}
kmp(未改进)完整代码:
//KMP算法
#include "sqstring.cpp"
void GetNext(SqString t,int next[]) //由模式串t求出next值
{
int j,k;
j=0;k=-1;next[0]=-1;
while (j<t.length-1)
{
if (k==-1 || t.data[j]==t.data[k]) //k为-1或比较的字符相等时
{
j++;k++;
next[j]=k;
printf("(1) j=%d,k=%d,next[%d]=%d\n",j,k,j,k);
}
else
{
k=next[k];
printf("(2) k=%d\n",k);
}
}
}
int KMPIndex(SqString s,SqString t) //KMP算法
{
int next[MaxSize],i=0,j=0;
GetNext(t,next);
while (i<s.length && j<t.length)
{
if (j==-1 || s.data[i]==t.data[j])
{
i++;j++; //i,j各增1
}
else j=next[j]; //i不变,j后退
}
if (j>=t.length)
return(i-t.length); //返回匹配模式串的首字符下标
else
return(-1); //返回不匹配标志
}
int main()
{
SqString s,t;
StrAssign(s,"ababcabcacbab");
StrAssign(t,"abcac");
printf("s:");DispStr(s);
printf("t:");DispStr(t);
printf("位置:%d\n",KMPIndex(s,t));
return 1;
}
kmp1(改进后)完整代码:
//改进的KMP算法
#include "sqstring.cpp"
void GetNextval(SqString t,int nextval[]) //由模式串t求出nextval值
{
int j=0,k=-1;
nextval[0]=-1;
while (j<t.length)
{
if (k==-1 || t.data[j]==t.data[k])
{
j++;k++;
if (t.data[j]!=t.data[k])
nextval[j]=k;
else
nextval[j]=nextval[k];
}
else k=nextval[k];
}
}
int KMPIndex1(SqString s,SqString t) //修正的KMP算法
{
int nextval[MaxSize],i=0,j=0;
GetNextval(t,nextval);
while (i<s.length && j<t.length)
{
if (j==-1 || s.data[i]==t.data[j])
{
i++;j++;
}
else j=nextval[j];
}
if (j>=t.length)
return(i-t.length);
else
return(-1);
}
int main()
{
SqString s,t;
StrAssign(s,"ababcabcacbab");
StrAssign(t,"abcac");
printf("s:");DispStr(s);
printf("t:");DispStr(t);
printf("位置:%d\n",KMPIndex1(s,t));
return 1;
}