28. 实现 strStr()
可以说是KMP算法的基础题型
KMP算法一般用于:用于在一个串中查找是否出现过另一个串。
KMP的经典思想就是:当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。(感觉挺像"备忘录")
KMP算法的关键便在于,用什么东西记录之前匹配过的文本内容,并且方便返回 =》 前缀表
前缀表:前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。(用于记录当前下标 i 与之前的字符串中,有多大长度相同的前缀后缀!!!)
注:而为什么要用前缀表?
因为找到了最长相等的前缀和后缀,匹配失败的位置是后缀子串的后面,那么我们找到与其相同的前缀的后面重新匹配就可以了。
假设是当前最长相等前缀长度
接下来分为两种情况讨论:(下一个字符是否相同)
1.如果下一个字符依然相同则最长前缀长度 + 1
2.如果下一个字符不相等
由于"ABA"无法与下一个字符构成更长的前后缀,则看其中是否存在更短的能够与之构成最长相等长度的前后缀
所以我们现在需要向前回退,则需要在回退到之前寻找可能与之对应的字符(回退后继续判断下一个字符是否相同,不同就继续回退)
&注:因为之前找到了最长相等的前缀和后缀,匹配失败的位置是后缀子串的后面,那么我们找到与其相同的前缀的后面重新匹配就可以了。
如下图:
而接下来就是如何用代码实现一个前缀表数组:
public void getNext(int[] next,String s){
int j = 0;
next[0] = 0;
for(int i = 1; i < s.length();i++){
while(j > 0 && s.charAt(j) != s.charAt(i)){// 前后缀不相同了
j = next[j - 1];
}
if(s.charAt(j) == s.charAt(i)){// 找到相同的前后缀
j++;
}
next[i] = j;
}
}
而最终代码就如下:
class Solution {
public int strStr(String haystack, String needle) {
if(needle.length() > haystack.length()) return -1;
int[] next = new int[needle.length()];
getNext(next,needle);
int j = 0;
for(int i = 0;i < haystack.length();i++){
while(j > 0 && needle.charAt(j) != haystack.charAt(i)){
j = next[j - 1];
}
if(needle.charAt(j) == haystack.charAt(i)){
j++;
}
if(j == needle.length()){
return i - needle.length() + 1;
}
}
return -1;
}
public void getNext(int[] next,String s){
int j = 0;
next[0] = 0;
for(int i = 1; i < s.length();i++){
while(j > 0 && s.charAt(j) != s.charAt(i)){
j = next[j - 1];
}
if(s.charAt(j) == s.charAt(i)){
j++;
}
next[i] = j;
}
}
}