问题
参考51nod1304这道题;
很显然我们要求的是S的每个后缀与S的最长公共前缀的长度之和。
暴力
假设我们把next[i]表示为第i个后缀与S的最长公共前缀的长度。
现在我们想了:这个next数组,如果暴力来求的话,时间复杂度是
O(n2)
。
这是我们回忆一下KMP:KMP物尽其用,然后呢就把求fail的速度提高到了
O(n)
。
那么我们在求next数组的时候,可不可以也使用这样的想法来物尽其用,尽可能地去除重复的匹配呢?
答案是肯定的。
引入扩展KMP
假设要处理出S的next数组,现在已经处理出前s的next了。
现在要求出下一个位置x的next。
其中维护一个li,使得
li=max{next[id]}(id∈[1,s])
。
由next[id]的定义,我们知道
S[id..li]=S[1..next[id]]
。
推得
S[x..li]=S[1+x−id..next[id]]
。
如果
id>1
,那么
1+x−id<x
,进一步
next[1+x−id]
我们已经是知道的了。
于是就有
S[x..li]=S[1..next[1+x−id]]
。
目前为止,我们很容易看出,x往后的
next[1+x−id]
这一段是可以不用匹配的。
但我们需要再分类一下:
1.x+next[1+x-id]-1<li
这种情况显然是
next[x]=next[1+x−id]
。
因为在li范围内,
next[1+x−id]
是极大的。
所以
next[x]
不会比
next[1+x−id]
更大。
2.x+next[1+x-id]-1>=li
这种情况虽然我们可以知道,[x,li]这一段是可以不用匹配的。
但是li以后的情况我们都是未知的。
那么我们暴力匹配来推进li。
于是乎就会有新的
li=next[x],id=x
。
重复上述过程,我们可以求出所有的next。
显然时间复杂度只与li的推进有关,即为
O(n)
。
回到本题
使用扩展KMP求出next后,求和即可。
我的博客。
扩展KMP的完全体
事实上本题只是扩展KMP的退化。
扩展KMP可以用于求一个串S的所有后缀与目标串T的最长公共前缀的的长度。
想法与求next数组一样。
设要求的东西叫ext。
其中维护一个li,使得
li=max{ext[id]}(id∈[1,s])
。
同理推得
S[x..li]=T[1..next[1+x−id]]
,其中next关于T。
那么依然分类讨论,即可求出ext。
最后贴上一个求next的程序
#include<iostream>
#include<stdio.h>
#include<math.h>
#include<string.h>
#include<algorithm>
#define ll long long
using namespace std;
const char* fin="ex1304.in";
const char* fout="ex1304.out";
const int inf=0x7fffffff;
const int maxn=1000007;
int n,i,j,k,limit,id;
ll ans;
char a[maxn];
int ne[maxn];
int main(){
scanf("%s",a+1);
n=strlen(a+1);
limit=0;
id=0;
ne[1]=n;
for (i=2;i<=n;i++){
j=ne[i-id+1];
if (i+j-1<limit) ne[i]=j;
else{
j=max(0,limit-i+1);
for (;j+i<=n;j++) if (a[i+j]!=a[j+1]) break;
if (i+j-1>limit){
limit=i+j-1;
id=i;
}
ne[i]=j;
}
}
for (i=1;i<=n;i++) ans+=ne[i];
printf("%lld",ans);
return 0;
}