已知
首先我想说kmp算法是一种规律,了解了那个规律之后再来看这个代码才好,不过就算不了解,看看这第一个函数还是很有意思的。`
#include<iostream>
using namespace std;
void next_ps(int*next, int len, char *s)
{
int k = 0;
next[0] = -1;
for (int i = 1; i < len; i++)
{
while (k > -1 && s[k + 1] != s[i])
{
k = next[k];
}
if (s[k + 1] == s[i])
k++;
next[i] = k;
}
}
我们来分析一下这个代码,我一直以为代码之所以难以理解很多时候是因为我们不知道写程序的人对于自己定义的变量的含义所导致的,我先来说一下这个代码的含义吧,首先我们可以看到k,k是一直再变化的,然后k的含义就是,草还挺难解释的,大概就是在字符串数组中0-i的最长前缀后缀匹配值,嗯,大概就是这样。然后我们在来解释一下next这个数组的含义,next数组储存的就是每一个i对应的k的值 next[i] = k;这个应该不难看出来。然后for循环就是遍历数组用的,为什么从i=1开始呢?因为next[1]的时候才有意义(最起码要有两个才可以匹配前缀和后缀吧!)然后我们在来看一下最精华的部分
while (k > -1 && s[k + 1] != s[i])
{
k = next[k];
}很显然条件是当K>-1且s[k + 1] != s[i]因为当k=-1的时候已经回溯的s[0]了已经没有必要在比较了。然后就是k=next[k]这个很好玩的东西了,很关键,我有点懒不想写了,大概就是重点理解k的含义那这个就不攻自破了。
int kmp(char s1, int len1, chart, int lent)
{
int next[100] = {};
int k = -1;
next_ps(next, lent, t);
for (int i = 0; i < len1; i++)
{
while (k > -1 && t[k + 1] != s1[i])
{
k = next[k];
}
if (t[k + 1] == s1[i])
k++;
if (k == lent - 1)
return i - lent + 1;
}
return -1;
}
这个函数返回的是找到匹配字符串在原字符串中首字符的位置,这个函数简单来说就是我们文章开头说的你们要懂的那个规律的代码实现方式。真正的“神来之笔”在上一个函数已经结束了。`
char temp[100] = "woshizhuwenzhuwenhai";
char tag[100] = "zhuwenhai";
cout << kmp(temp, strlen(temp), tag, strlen(tag));
这一段是我测试用的,结果:
很明显没错。