leetcode 28. 实现 strStr()
题目链接:找字符串中第一个匹配的下标
KMP的算法的关键是求next数组,next数组的求法分为四个步骤:
- 初始化,定义两个指针i和j,j指向前缀末尾位置(同时j表示 i(包括i)之前最长相等的前后缀长度),i指向后缀末尾位置
- 处理前后缀不相同的情况
- 处理前后缀相同的情况
- 更新next数组
方法一:采用前缀表直接表示next数组的方法
next的函数代码:
void getNext(int* next, const string& s) {
int j = 0;
next[0] = 0;
for(int i = 1; i < s.size(); i++) { // 注意i从1开始
while (j > 0 && s[i] != s[j]) { // 前后缀不相同了
j = next[j-1]; // 向前回退
}
if (s[i] == s[j]) { // 找到相同的前后缀
j++;
}
next[i] = j; // 将j(前缀的长度)赋给next[i]
}
}
整体代码如下:
class Solution {
public:
void getNext(int* next, const string& s) {
int j = 0;
next[0] = 0;
for(int i = 1; i < s.size(); i++) {
while (j > 0 && s[i] != s[j]) {
j = next[j - 1];
}
if (s[i] == s[j]) {
j++;
}
next[i] = j;
}
}
int strStr(string haystack, string needle) {
if (needle.size() == 0) {
return 0;
}
int next[needle.size()];
getNext(next, needle);
int j = 0; // 因为next数组里记录的起始位置为0
for (int i = 0; i < haystack.size(); i++) {// 注意i就从0开始
while(j > 0 && haystack[i] != needle[j]) {//匹配不成功
j = next[j - 1]; // j寻找之前匹配的位置
}
if (haystack[i] == needle[j]) {// 匹配,j和i同时向后移动
j++; //i的移动在for循环里
}
if (j == needle.size() ) { // 文本串s里出现了模式串t
return (i - needle.size() + 1);
}
}
return -1;
}
};
方法二:采用前缀表统一减一的方法
class Solution {
public:
void getNext(int* next, const string& s) {
int j = -1;
next[0] = j;
for(int i = 1; i < s.size(); i++) { // 注意i从1开始
while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
j = next[j]; // 向前回退
}
if (s[i] == s[j + 1]) { // 找到相同的前后缀
j++;
}
next[i] = j; // 将j(前缀的长度)赋给next[i]
}
}
int strStr(string haystack, string needle) {
if (needle.size() == 0) {
return 0;
}
int next[needle.size()];
getNext(next, needle);
int j = -1; // // 因为next数组里记录的起始位置为-1
for (int i = 0; i < haystack.size(); i++) { // 注意i就从0开始
while(j >= 0 && haystack[i] != needle[j + 1]) { // 不匹配
j = next[j]; // j 寻找之前匹配的位置
}
if (haystack[i] == needle[j + 1]) { // 匹配,j和i同时向后移动
j++; // i的增加在for循环里
}
if (j == (needle.size() - 1) ) { // 文本串s里出现了模式串t,注意与方法一的不同
return (i - needle.size() + 1);
}
}
return -1;
}
};
总结
1.时间复杂度分析:定义n为文本串长度,m为模式串长度,因为在匹配的过程中,根据前缀表不断调整匹配的位置,可以看出匹配的过程是O(n),单独生成next数组,时间复杂度是O(m)。所以整个KMP算法的时间复杂度是O(n+m)。
2.前缀表可以通过统一减一和不减一得到的next数组表示,这是kmp算法的两种实现方式。
3.本题的关键是求next数组,需要将next数组分离出来,然后通过next数组进行指针回退的处理
4.注意以上两种方法的初始化值的差别,以及最后判断是否匹配成功的条件的差别。