1.朴素模式简单匹配算法
算法思想:
在主串中寻找与模式串相同的子串,并返回子串开始位置。变量k记录扫描开始位置,若匹配成功,则为子串开始位置,时间复杂度为O(m*n)。
代码如下:
int PatternMatching(SString S, SString T){
int k=1;
int i=k, j=1;
while(i<S.length && j<T.length){
if(S.ch[i]==T.ch[j]){
i++;
j++;
}else{
k++;
i=k;
j=1;
}
}
if(j>T.length)
return k;
else
return 0;
}
2.KMP算法
算法思想:
对主串来说,回溯会产生较高的时间复杂度。KMP算法中,主串指针并不回溯,而模式串指针会根据机算或手算的next数组进行回溯,大大减少了比较的次数,时间复杂度为O(m+n)。
next数组求解:
next数组的含义是当主串和模式串元素比较出现失配情况时,模式串指针重新指向进行比较的位置。先理解前缀、后缀和部分匹配值的含义。
前缀:除最后一个字符以外,字符串的所有头部字串。
后缀:除第一个字符以外,字符串的所有尾部子串。
部分匹配值:字符串的前缀和后缀的最长相等前后缀长度。
而next数组的值为部分匹配值加1,其中若j=1失配,则需要更换子串,i,j均需重新比较,故设置next[1]=0,若j=2失配,前面只有1个元素,部分匹配值为0,故next[2]=1,这两位固定不变。
代码如下:
int_KMP(SString S, SString T, int next[]){
int i=1, j=1;
while(i<=S.length && j<=T.length){
if(j==0 || S.ch[i]==T.ch[j]){
i++;
j++;
}
else{
j=next[j];
}
}
if(j>T.length)
return i-T.length;
else
return 0;
}
next数组优化:
若出现相同的元素出现失配时,next[j]的值和之前元素的next值相同即可。