串的模式匹配算法
子串的定位操作通常称为串的 模式匹配,其中T称为 模式串。
一般的求子串位置的定位函数(Brute Force)
我写java的代码是这样的
int index(String S,String T,int pos){
char[] s_arr = S.toCharArray();
char[] t_arr = T.toCharArray();
int i,j,k;//i是主串S的指针,j是模式串的指针
if(pos < 0 || pos>S.length() ||
S.length() < T.length() || pos+T.length()>S.length())
return -2;
/*最外层是与主串匹配的最多次数,从数组下标为0开始匹配,i表示当前匹配是
从主串下标为i的元素开始的*/
for(i = pos-1;i < S.length()-T.length();i++){
/*内层循环是模式串的循环,j表示当前匹配指针的位置*/
for(j=0;j<T.length();j++){
/*i+j是主串上指针的位置,如果两者不匹配,则将主串的指针挪后
一个位置,模式串指针从头开始,重新匹配*/
if(s_arr[i+j] != t_arr[j]){
break;
}
}
/*与模式串的匹配结束,判断模式串的指针位置*/
if(j>=T.length())
return i;
}
return -1;
}
书上的算法是这样的(伪码)
int index(String S,String T,int pos){
/*返回子串T在主串S中第pos位置字符后的位置,若不存在,返回值为0
其中T非空,1<=pos<=S.length,S[0]和T[0]位置存储字符串长度
*/
i = pos;j = 1;
while(i <= S[0] && j <= T[0]){
if(S[i] == T[j]){
i++;j++/*两个串的指针后退*/
}
else{
i = i-j+2;j = 1;/*主串的指针后退i-j+2个单位,由于下标从1开始
主串中j-i+1的位置与模式串1位置对应,再向后挪一个单位得。*/