做字符串模式匹配时用到.
无论是c/c++还是java,字符串的查找方法的时间复杂度都是n2,而kmp是n的复杂度.
kmp的关键步骤(代码是直接在网上借鉴的)
1.求出要匹配字符串的next数组(前i-1个的字符串的最长相同真前后缀长度)
/* P 为模式串,下标从 0 开始 */
void GetNext(string P, int next[])
{
int p_len = P.size();
int i = 0; // P 的下标
int j = -1; //相同前后缀长度,同时是下标
next[0] = -1;
while (i < p_len - 1)
{ //j一定比i小
if (j == -1 || P[i] == P[j])//可以理解为j每次都从开头重新匹配
{
i++;
j++;
next[i] = j;
}
else
j = next[j];//自己匹配自己,回到上一个相同前后缀的地方其实j=-1也行(对时间影响不大除非数据特别挑剔)
}
}
2.利用next数组进行快速匹配
/* 在 S 中找到 P 第一次出现的位置 */
int KMP(string S, string P)
{
GetNext(P, next);
int i = 0; // S 的下标
int j = 0; // P 的下标
int s_len = S.size();
int p_len = P.size();
while (i < s_len && j < p_len)//结束条件S遍历结束或完全匹配
{
if (j == -1 || S[i] == P[j]) // P 的第一个字符不匹配或 S[i] == P[j]
{
i++;
j++;
}
else
j = next[j]; // 当前字符匹配失败,进行跳转(前缀相同,直接视为已经匹配)
}
if (j == p_len) // 匹配成功
return i - j;//下标
return -1;
}
优化后的kmp的getNext(防止了重复匹配相同的无效前缀,不能用来解决字符串重复问题,但速度快)
/* P 为模式串,下标从 0 开始 */
void GetNextval(string P, int nextval[])
{
int p_len = P.size();
int i = 0; // P 的下标
int j = -1;
nextval[0] = -1;
while (i < p_len - 1)
{
if (j == -1 || P[i] == P[j])
{
i++;
j++;
if (P[i] != P[j])
nextval[i] = j;
else
nextval[i] = nextval[j]; // 既然相同就继续往前找真前缀
}
else
j = nextval[j];
}
}
kmp算法比较难理解,博主也还没完全弄明白,本篇代码借鉴处—>KMP算法