#include<iostream>
#include<vector>
#include<queue>
using namespace std;
/*
next数组的含义
初始化:
next[0] = -1;
next[i]:当当前位置不匹配时,需要回溯的位置
如模板串 ababa
next[] = {-1, 0, 0, 1, 2, 3} //最后一个位置next[5]=3 代表全部匹配需要回溯的位置,即前面有3个字符是重复的。
可以看出next[i]其实也是当前下标的前x个字符中 前缀和后缀的最大重复子串的数量,如next[3] = 1, 即第二个b字符前的字符串为aba,他的前缀和后缀的最大重复子串的数量为1,因此next[3]=1
*/
// 求next数组
void get_next(vector<int>& next, string s)
{
// i是后缀 j是前缀
int i = 0, j = -1;
next[0] = -1;
while (i < s.length())
{
if (j == -1 || s[i] == s[j])
{
i++;
j++;
next[i] = j;
}
else
{
j = next[j];
}
}
}
/*
输入:
s1主串 s2模板串
输出:
如果模板串s2在s1主串中出现,返回在s1中第一次出现的下标,否则返回-1
*/
int kmp(string s1, string s2)
{
vector<int> next(s2.length()+1, -1);
get_next(next, s2);
int i = 0;
int j = 0;
int len1 = s1.length();
int len2 = s2.length();
while (i < len1 && j < len2) //不能用j < s2.length() 因为无符号和有符号的比较会将有符号转为无符号,会出现错误
{
if (j == -1 || s1[i] == s2[j])
{
i++;
j++;
}
else
{
j = next[j];
}
}
if (j == s2.length())
return i - j;
else
return -1;
}
int main()
{
string s1 = "abababab";
string s2 = "ababab";
cout << kmp(s1, s2) << endl;
return 0;
}
牛客网的KMP算法例题
在
后面加上
if(j == len2)
{
res++;
j = next[j];
}
即可