目录
在我们去用关键词查找微信或者qq聊天记录的时候,我们总不能一句一句去找吧。我们需要用到的功能底层大概是此博客所讲的这个函数熬。
需要传入的就是关键词和所有的文本,返回的是当前关键词出现的首个位置。
在查找字符串的时候,有时不需要每次都从头再来。我们偶尔需要抄抄近路,从当前已知的结果提取信息。所以,我们的next[]数组出现了。
这三位学者发明的:Knuth,Morris和Pratt,所以取了三位学者名字的首字母。所以叫做KMP。
前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。
前缀表的任务是当前位置匹配失败,找到之前已经匹配上的位置,再重新匹配,此也意味着在某个字符失配时,前缀表会告诉你下一步匹配中,模式串应该跳到哪个位置。
就是寻找在当前字符是否是与原字符串起始位置相同,如果是相同的那就是1,但如果该字符左侧就是已经匹配过的片段,那直接加1后判断下一个字符,比如下面的next[]
简单介绍该函数的作用
在我们去用关键词查找微信或者qq聊天记录的时候,我们总不能一句一句去找吧。我们需要用到的功能底层大概是此博客所讲的这个函数熬。
一.算法需要传入的参数和返回类型
需要传入的就是关键词和所有的文本,返回的是当前关键词出现的首个位置。
二.字符串匹配的方法(KMP算法)
在查找字符串的时候,有时不需要每次都从头再来。我们偶尔需要抄抄近路,从当前已知的结果提取信息。所以,我们的next[]数组出现了。
那什么是KMP呢?
这三位学者发明的:Knuth,Morris和Pratt,所以取了三位学者名字的首字母。所以叫做KMP。
那什么是next[]呢(回退表)?
前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。
那一个前缀表是如何记录我们要跳到哪个位置去的呢?
前缀表的任务是当前位置匹配失败,找到之前已经匹配上的位置,再重新匹配,此也意味着在某个字符失配时,前缀表会告诉你下一步匹配中,模式串应该跳到哪个位置。
三.算法的实现
1.前缀表的实现:
void getNext(int* next, const string& s) {
int j = -1;
next[0] = j;
for(int i = 1; i < s.size(); i++) { // 注意i从1开始
while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
j = next[j]; // 向前回退
}
if (s[i] == s[j + 1]) { // 找到相同的前后缀
j++;
}
next[i] = j; // 将j(前缀的长度)赋给next[i]
}
}
2.核心代码
int strStr(string haystack, string needle) {
if (needle.size() == 0) {
return 0;
}
int next[needle.size()];
getNext(next, needle);
int j = -1; // // 因为next数组里记录的起始位置为-1
for (int i = 0; i < haystack.size(); i++) { // 注意i就从0开始
while(j >= 0 && haystack[i] != needle[j + 1]) { // 不匹配
j = next[j]; // j 寻找之前匹配的位置
}
if (haystack[i] == needle[j + 1]) { // 匹配,j和i同时向后移动
j++; // i的增加在for循环里
}
if (j == (needle.size() - 1) ) { // 文本串s里出现了模式串t
return (i - needle.size() + 1);
}
}
return -1;
}