找出字符串中第一个匹配项的下标
KMP算法
当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。
-
前缀表(next数组)
前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。
-
前缀表储存的值:记录下标i之前(包括i)的字符串中,有多大长度的相同前缀后缀
-
前缀表如何计算(构造next数组):
next数组既可以就是前缀表,也可以是前缀表统一减一(右移一位,初始位置为-1)
- 初始化
- 处理前后缀不相同的情况
3.处理前后缀相同的情况
void getNext(int* next, const string& s){ /* 初始化 */ int j = -1; next[0] = j; for(int i = 1; i < s.size(); i++) { // 注意i从1开始 /*前后缀不相同*/ while (j >= 0 && s[i] != s[j + 1]) { j = next[j]; // 向前回退 } /*前后缀相同*/ if (s[i] == s[j + 1]) { j++; } next[i] = j; // 将j(前缀的长度)赋给next[i] } }
-
-
使用next数组来做匹配
int j = -1; // 因为next数组里记录的起始位置为-1
for (int i = 0; i < s.size(); i++) { // 注意i就从0开始
while(j >= 0 && s[i] != t[j + 1]) { // 不匹配
j = next[j]; // j 寻找之前匹配的位置
}
if (s[i] == t[j + 1]) { // 匹配,j和i同时向后移动
j++; // i的增加在for循环里
}
if (j == (t.size() - 1) ) { // 文本串s里出现了模式串t
return (i - t.size() + 1);
}
}
- 当模式组为空时,返回0
重复的子字符串
-
为什么会使用KMP
- 在由重复子串组成的字符串中,最长相等前后缀不包含的子串就是最小重复子串
-
如何找到最小重复子串
- len - (next[len - 1] + 1)
-
len % (len - (next[len - 1] + 1)) == 0 是充分必要条件吗?
-
len % (len - (next[len - 1] + 1)) == 0 一定推导出字符串s由重复子字符串构成:
- 字符串s由重复子字符串一定推导出len % (len - (next[len - 1] + 1)) == 0 :
总结
- 节省空间使用双指针解题
- 判断双指针的起始位置
- 双指针如何移动
- KMP算法