1.1 朴素模式匹配算法
算法思想:
分别用计数指针i和j指示主串S和模式串T当前正待比较的字符位置。从主串S的第一个字符起,与模式串T的第一个字符比较,若相等,则继续逐个比较后继字符;否则从主串的下一个字符起,重新和模式串的字符比较;以此类推,直至模式串T中的每个字符依次与主串S中的一个连续的字符序列相等,则称匹配成功,函数值为与模式串 T 中第一个字符相等的字符在主串 S 中的序号,否则称匹配不成功,函数值为零。
模式串T=‘a b c a c’与主串S='a b a b c a b c a c b a b' 的匹配过程:
算法实现:
int Index(SString S,SString T){
int i=1,j=1;
while(i<=S.length && j<=T.length){
if(S.ch[i]==T.ch[j]){
++i;
++j; //继续比较后继字符
}
else{
i=i-j+2;
j=1; //指针后退重新开始匹配
}
}
if(j>T.length)
return i-T.length;
else
return 0;
}
1.2 KMP算法
算法思想:
从分析模式本身的结构着手,如果已匹配相等的前缀序列中有某个后缀在好是模式的前缀,那么就可以将模式向后滑动到与这些相等字符对齐的位置,主串i指针无须回溯,并从该位置开始继续比较。
移动的位数 = 已比较的字符数 - 对应的部分匹配值
模式串T=‘a a b a a c’与主串S='a a b a a b a a b a a c' 的匹配过程:
求next值的程序:
void get_next(SString T,int next[]){
int i=1,j=0;
next[1] = 0;
while(i<T.length){
if(j==0 || T.ch[i]==T.ch[j]){
++i;++j;
next[i] = j; //若模式串第i个字符和第j个字符匹配,则next[j+1]=next[j]+1
}
else
j = next[j]; //否则,令j=next[j],循环继续
}
}
KMP匹配算法实现:
int Index_KMP(SString S,SString T,int next[]){
int i=1,j=1;
while(i<S.length && j<T.length){
if(j==0 || S.ch[i]==T.ch[j]){
++i;++j; //继续比较后继字符
}
else
j=next[j]; //模式串向右移动
}
if(j>T.length)
return i-T.length;
else
return 0;
}
1.3KMP算法的进一步优化
前面定义的next数组在某些情况下仍有缺陷,还可以进一步优化。
求nextval值的程序:
void get_nextval(SString T,int nextval[]){
int i=1,j=0;
nextval[1] = 0;
while(i<T.length){
if(j==0 || T.ch[i]==T.ch[j]){
++i;++j;
if(T.ch[i]!=T.ch[j])
nextval[i] = j;
else
nextval[i] = nextval[j];
}
else
j=nextval[j];
}
}