网址:https://vjudge.net/problem/POJ-2752
题意:
给定若干字符串(这些字符串总长 ≤ $400000$ ),在每个字符串中求出所有既是前缀又是后缀的子串长度。
例如:$ababcababababcabab$,既是前缀又是后缀的:$ab$,$abab$,$ababcabab$,$ababcababababcabab$。
题解:
使用kmp算法。我们知道$next[i]$是$i$之前的子字符串中相同前缀和后缀的最长长度。则可以这么考虑:从$next[str.size()]$开始,$next[str.size()]$的值就是整个字符串前缀和后缀的最长长度,令其为$k$,$len$为$str.size()$,则$0$~$k-1$和$len-k$~$len-1$都一样。则这个是答案。然后因为$0$~$k-1==len-k$~$len-1$,令$len=k$,则对于这个$0$~$k-1$子字符串中,其必存在和原字符串相同的后缀。
如果$k>len/2$则$len-k$~$k-1$在前后缀中重叠。如$abcabcabc$,能推出字符串一定存在一个以上周期且非重叠部分各占一个周期。
如果$k=len/2$则刚好两个周期。
如果$k<len/2$则在$0$~$k-1$的子串中,存在和原字符串后缀相同的后缀。
然后一直递归令$len=k;k=next[len]$直到$k==0$,逆序输出即得结果。
AC代码:
#include <iostream>
#include <string>
#include <cstring>
using namespace std;
int nextarray[400005];
int ans[400005];
void getnext(string &str)
{
memset(nextarray, 0, sizeof(nextarray));
int j = -1, k = 0;
nextarray[0] = -1;
while (k < str.size())
{
if (j == -1 || str[j] == str[k])
nextarray[++k] = ++j;
else
j = nextarray[j];
}
}
void solve(string &str)
{
int i = 0, j = str.size();
memset(ans, 0, sizeof(ans));
ans[i++] = str.size();
while (nextarray[j])
{
ans[i++] = nextarray[j];
j = nextarray[j];
}
for (int k = i - 1; k >= 0; --k)
{
cout << ans[k];
if (k > 0)
cout << " ";
}
cout << endl;
}
int main()
{
string a;
while (cin >> a)
{
getnext(a);
solve(a);
}
return 0;
}