leetcode-28.字符串匹配
KMP算法(三个人名字命名)
解决的问题:主要应用在字符串匹配问题上
主要思想是,当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,利用这些信息避免从头重新匹配,以此提升效率。
leetcode-28字符串匹配:
暴力解法:两层循环,第一层匹配字符串与模式串的首字母,第二层匹配剩下的字母,
复杂度O(m*n)
KMP算法:
前缀表,要知道一个字符串中最长相等前后缀
例如:aabaaf,
a的最长相等前后缀=0
aa的最长相等前后缀=1
aab的最长相等前后缀=0
aaba的最长相等前后缀=1
aabaa的最长相等前后缀=2
aabaaf的最长相等前后缀=0
那么 0,1,0,1,2,0就是前缀表(next数组)
前缀表的求法:
放置两个指针,j指向前缀末位,i指向后缀末位(初始两个指针相差为1)
两个指针同时移动,匹配前缀和后缀(这里实际上把前缀串作为匹配串,后缀串作为模板串)
如果遇到next[i]不等于next[j],那么匹配失败,前缀串(模板串)的末位j须参照已经记录的next前缀表回退 j = next[j-1],然后继续匹配,匹配成功则意味着next[i] = j。
直到i遍历到整个模板串的最后。
匹配流程:
匹配流程与前缀表构建基本一致,两个指针分别指向模板串和匹配串,顺序匹配,遇到匹配失败的字符模板串指针根据next指引回退,直至匹配成功或者失败。
KMP算法的时间复杂度为O(m+n),代码如下:
class Solution {
public:
int strStr(string haystack, string needle) {
int next[needle.size()];
getNext(next, needle);
int j = -1;
for(int i=0; i<haystack.size(); i++){
while(j>=0 && haystack[i] != needle[j+1]){
j = next[j];
}
if(haystack[i] == needle[j+1]){
j++;
}
if(j == (needle.size()-1)){
return i-j;
}
}
return -1;
}
void getNext(int* next, const string s){
int j = -1;//指向前缀末位
next[0] = j;
for(int i=1; i<s.size(); i++){//i指向后缀末位
while(j>=0 && s[i] != s[j+1]){//如果匹配失败,那就找到最长相等前缀末位位置继续匹配
j = next[j];//j+1处匹配失败,那么j+1就调整到最长相等前缀末位next[j]的下一位继续匹配即next[j]+1
}
if(s[i] == s[j+1]){
j++;//如果前后缀的末位能一直匹配下去
}
next[i] = j;
}
}
};