如果想了解更多内容,欢迎关注我的微信公众号:信息学竞赛从入门到巅峰。
今天和大家讲讲KMP算法的基本原理和实现。
KMP算法能够在O(N)的时间内完成字符串自身的匹配,其精髓主要在于next数组。
next[i]的意义是在字符串的前 i 个字符中,前缀等于后缀的最长的长度是多少。这么说可能有点抽象,我们来看一下下面这个例子。
对于 ABAABB 这个字符串,他的next数组的值如下所示(为了方便说明,字符串的第一个字符的位置记为1):
以next[5]举一个更详细的例子:
相信大家对next数组的含义有了清楚的认知,接下来讲一讲怎么求next数组。
利用动态规划(DP)的思想,假设我们现在要求next[i + 1]的值,而next[1] ~ next[i] 全部都已经求出来了,那么我们知道了前i个字符组成的字符串的最长能匹配的前缀和后缀,那么可以直接判断下一个是否相等(记字符串数组为 s[]):
-
如果二者相等(即 s[next[i]] + 1 == s[i + 1]),那么很显然直接 +1 就可以了。
-
如果二者不相等,那么不断往前跳一个next 来尝试是否能匹配,直到能够匹配时跳出循环,进行转移。
核心代码如下:
cin >>s;
int m=s.size();
s=" "+s; j=0;
for (int i=2;i<=m+1;++i) {
while (j>0 && s[j+1]!=s[i])j=p[j];
if (s[j+1]==s[i])j++;
p[i]=j;
}