前言:kmp算法其实并不复杂,但对于刚接触的人来说,还是有些绕弯子的。对next[]数组建立有疑问的同学,可以看这篇文章——https://www.cnblogs.com/dusf/p/kmp.html
一、串的模式匹配
bf(暴力匹配算法):最坏时间复杂度O(mn)
KMP算法:时间复杂度O(m+n)
二、代码
1.bf算法(暴力破解)
代码如下(示例):
int bfIndex(sqString text, sqString pat)
{
int i = 0, j = 0;
while (i < text.length && j < pat.length)
{
if (text.data[i] == pat.data[j])
{
i++;
j++;
}
else
{
i = i - j + 1;
j = 0;
}
}
if (j == pat.length)
return i - j;
return 0;
}
代码比较简单我就不啰嗦了
2.KMP算法
代码如下(示例):
void getNext(sqString sq, int next[]) //建立next[]数组
{
int j = 0, k = -1;
next[0] = -1;
while (j < sq.length - 1)
{
if (k == -1 || sq.data[k] == sq.data[j])
{
/* next[++j] = ++k; */ //这行是没有优化过的算法
//加上if和else对next数组进行优化,当两个字符相等时要跳过
if (sq.data[++j] == sq.data[++k])
next[j] = next[k]; //next[j] = k,表示当!=时,j指针的下一个位置
else
next[j] = k;
}
else
{
k = next[k]; //这句代码简单解释就是,如果不相等后,找出最长重复子串
}
}
}
void KmpIndex(sqString text, sqString pat)
{
int next[MaxSize];
getNext(pat, next);
int i = 0, j = 0;
for (int n = 0; n < pat.length; n++)
cout << pat.data[n] << ":" << next[n] << endl;
while (i < text.length && j < pat.length)
{
if (j == -1 || text.data[i] == pat.data[j])
{
i++;
j++;
}
else
{
j = next[j]; //与bf算法不一样的只有这句,即“!=”后j指针指向的位置
}
}
if (j == pat.length)
cout << i - j << endl;
else
cout << "false" << endl;
}
总结
注意,本篇代码next[0]=-1,还可以将next[0]赋值为0,这样得到的next数组所有对应的部分匹配值都要加1。同时优化后的next为nextval,他的作用是当有两个相同的字符时跳过,例如子串为ababbd,对应的next数组为 next[0]=-1,next[1]=0,next[2]=-1,ext[3]=0,next[4]=2,next[5]=0。
详细解释可以看我推荐的文章。