简单模式匹配算法和KMP算法
简单模式匹配算法的代码
int Index(SString S, SString T){
int i = 1, j = 1, k = i; // 初始化索引i, j, k
while(i <= S.length && j <= T.length){ // 循环直到任一字符串结束
if(S.ch[i] == T.ch[j]){ // 如果当前字符匹配
i++;
j++;
} else { // 如果不匹配
i = k + 1; // i回到主串的下一个可能匹配位置
j = 1; // j重置为模式串的开始位置
k = i; // 更新k为下一次比较的开始位置
}
}
if(j > T.length) // 如果模式串已经完全匹配,则返回匹配的起始索引
return k;
else // 否则返回0表示没有找到匹配
return 0;
}
这段代码定义了一个Index
函数,它接受两个SString
类型的参数S
(主串)和T
(模式串)。函数的目的是找出模式串T
在主串S
中的第一次出现位置。如果找到匹配,返回匹配的起始索引k
;如果没有找到,返回0。
KMP算法的代码
KMP算法的代码分为两部分:一部分是预处理函数get_next
,另一部分是搜索函数KMP
。
- 预处理函数
get_next
void get_next(SString T, int next[]){
int i = 1, j = 0;
next[1] = 0; // 初始化next数组的第一个元素
while(i < T.length){
if(j == 0 || T.ch[i] == T.ch[j]){
i++;
j++;
next[i] = j; // 更新next数组
} else {
j = next[j]; // j回溯到next数组指定的位置
}
}
}
这个函数用来生成next
数组,该数组用于存储模式串T
的前缀和后缀的最长相同子串的长度。next
数组在KMP算法中起到关键作用,帮助算法在不匹配的情况下快速回溯到正确的位置。
- 搜索函数
KMP
int KMP(SString S, SString T, int next[]){
int i = 1, j = 1;
while(i <= S.length && j <= T.length){
if(j == 0 || S.ch[i] == T.ch[j]){
i++;
j++;
} else {
j = next[j]; // 如果当前字符不匹配,根据next数组回溯
}
}
if(j > T.length) // 如果模式串完全匹配,返回匹配的起始索引
return i - T.length;
else // 否则返回0表示没有找到匹配
return 0;
}
KMP
函数使用预处理得到的next
数组来提高搜索效率。当主串S
和模式串T
的当前字符匹配时,两个索引同时向后移动;如果不匹配,模式串的索引j
根据next
数组回溯到下一个可能的匹配位置。如果模式串完全匹配,返回匹配的起始索引;如果没有找到匹配,返回0。