一、简单算法
int Index(SString S,SString T,int pos){
i=pos;j=1;
while(i<=S[0]&&j<=T[0]){
if(S[i]==T[j]){++i;++j}
esle {i=i-j+2;j=1;}
}
if(j>T[0]) return i-T[0];
esle return 0;
}
二、首尾匹配算法
先比较模式串第一个字符,再比较模式串的最后一个字符,最后比较模式串中从第二个到第n-1个字符。
int Index_FL(SString S,SString T,int pos){
sLength=S[0];tLength=T[0];i=pos;
patStartChar=T[1];patEndChar=T[tLength];
while(i<=sLength-tLength+1){
if(S[i]!=patStartChar)++i;
else if(S[i+tLength-1]!=patEndChar)++i;
//模式串的尾字符不匹配
else{
//检查中间字符的匹配情况
k=1;j=2;
while(j<tLength&&S[i+k]=T[j])
{++k,++j;}
if(j==tLength)return i;
else ++i;
}
}
return 0;
}
三、KMP(D.E.Knuth,V.R.Pratt,J.H.Morris)算法
KMP算法的时间复杂度可以达到O(m+n)
当S[i]<>T[j]时,
已经得到的结果:
S[i-j+1..i-1]==T[1..j-1]
若已知T[1..k-1]==T[j-k+1..j-1]
则有S[i-k+1..i-1]==T[1..k-1]
定义:模式串的next函数
0当j=1时
Max{k|1<k<j且'p1...pk'='pj-k+1...pj-1'}当集合不空时
next[j]=
1 其他情况
int Index_KMP(SString S,SString T,int pos){
i=pos;j=1;
while(i<=S[0]&&j<=T[0]){
if(j==0||S[i]==T[j]){++i;++j}
esle {j=next[j];}
}
if(j>T[0]) return i-T[0];
esle return 0;
}
求next函数值的过程是一个递推过程,分析如下:
已知:next[1]=0;
假设:next[j]=k;又T[j]=T[k]
则:next[j+1]=k+1
若:T[j]!=T[k]
则需往前回朔,检查T[j]=T[?]
void get_next(SString &T,int &next[]){
i=1;next[1]=0;j=0;
while(i<T[0]){
if(j==0||T[i]==T[j]){++i;++j;next[i]=j;}
esle {j=next[j];}
}
}
还要考虑一种特殊的情况需要考虑:
例如:
S='aaabaaabaaabaaabaaab'
T='aaaab'
next[j]=01234
修正
void get_nextval(SString &T,int &nextval[]){ i=1;nextval[1]=0;j=0;
while(i<T[0]){ if(j==0||T[i]==T[j]){++i;++j;
if(T[i]!=T[j])nextval[i]=j;
else nextval[i]=nextval[j];
} esle {j=next[j];} } }