求next数组
注意点:因为string的.size()、.length() 方法,返回的是unsigned的数据,所以,如果使用负数和s.size()进行比较会出现意想不到的问题,并且如果s的长度是0,则s.size() - 1,也是会出问题的。
关于string的.size()、.length()返回无符号整数,可以看一下这篇博客
// 对模式串生成 next数组
void getNext(string s, int next[]) {
// i 表示当前模式串 i 位置的字符和文本串不匹配
int i = 0;
// j
// 代表当模式串i字符和文本串不匹配时,应该使用模式串的j字符去和文本串当前字符尝试匹配
// -1表示特殊位置,此时模式串第一个字符就和文本串不匹配的话,使用-1标记,表示需要后移模式串
int j = -1;
// 如果模式串第一个字符就和文本串的当前字符不匹配,使用-1进行特殊标记,表示特殊情况,需要让模式串和文本串的写一个字符进行对比
next[0] = -1;
// 注意判断条件是 < s.size() - 1
while (i < (int)(s.size() - 1)) {
if (j == -1 || s[i] == s[j]) {
// 此处更新了 i、j 指针
i++;
j++;
// 将next[i] 赋值为 j
next[i] = j;
} else {
// j 指针回溯
j = next[j];
}
}
}
改进next数组,求nextVal数组
注意点:还是上面说的,如果一旦涉及到字符串长度的比较、运算,记得要强制类型转换成int类型的
// 对模式串生成 nextVal数组
void getNextVal(string s, int nextVal[]) {
// i 表示当前模式串 i 位置的字符和文本串不匹配
int i = 0;
// j
// 代表当模式串i字符和文本串不匹配时,应该使用模式串的j字符去和文本串当前字符尝试匹配
// -1表示特殊位置,此时模式串第一个字符就和文本串不匹配的话,使用-1标记,表示需要后移模式串
int j = -1;
// 如果模式串第一个字符就和文本串的当前字符不匹配,使用-1进行特殊标记,表示特殊情况,需要让模式串和文本串的写一个字符进行对比
nextVal[0] = -1;
// 注意判断条件是 < s.size() - 1。最好加上强制类型转换
while (i < (int)(s.size() - 1)) {
if (j == -1 || s[i] == s[j]) {
// 此处更新了 i、j 指针
i++, j++;
// 更新了i、j之后,立刻根据当前的两个字符是否相同,更新nextVal[i]的值
if (s[i] != s[j]) {
nextVal[i] = j;
} else {
nextVal[i] = nextVal[j];
}
} else {
// j指针回溯,不是next[j],而是nextVal[j]
j = nextVal[j];
}
}
}
使用next、nextVal数组进行kmp的匹配
注意点:j要和 s2.size() 进行比较,而 j 可能取-1,一旦一个负数和unsigned 的整数比较,就会出现意想不到的结果。所以,要进行强制类型转换
int getPos(string s1, string s2, int next[]) {
// 指向s1当前字符
int i = 0;
// 指向s2当前字符
int j = 0;
// 一定注意,此处要强制类型转换为(int),否则j == -1 时,直接退出 !!!!!!!!!!!!!!!!!!!!!!!!!
while (i < s1.size() && j < (int)s2.size()) {
if (j == -1 || s1[i] == s2[j]) {
i++;
j++;
} else {
j = next[j];
}
}
return j == s2.size() ? i - (int)s2.size() : -1;
}
来一个例子:
int main() {
string s1 = "aaaabaafbaaaabaaaabaababaaababaaabaaabaafbfa";
string s2 = "ababaaababaa";
int next[s2.size()];
getNext(s2, next);
printf("求得的 next 数组是:\n");
for (int i : next) {
printf("%d ", i);
}
printf("\n");
int nextVal[s2.size()];
getNextVal(s2, nextVal);
printf("求得的 nextVal 数组是:\n");
for (int i : nextVal) {
printf("%d ", i);
}
printf("\n");
printf("使用 next 数组求得的开始匹配位置为:%d\n", getPos(s1, s2, next));
printf("使用 nextVal 数组求得的开始匹配位置为:%d\n", getPos(s1, s2, nextVal));
return 0;
}
运行结果:
求得的 next 数组是:
-1 0 0 1 2 3 1 1 2 3 4 5
求得的 nextVal 数组是:
-1 0 -1 0 -1 3 1 0 -1 0 -1 3
使用 next 数组求得的开始匹配位置为:20
使用 nextVal 数组求得的开始匹配位置为:20