Explanation
一道KMP模板应用题。
PS:这个算法的名字比较诡异是因为它由三位伟大的科学家共同设计:D.E.Knuth,J.H.Morris和V.R.Pratt。
KMP模板长这样(详见《算法竞赛进阶指南》p.66 或 洛谷题解):
void KMP() {
Next[1] = 0;
for (int i = 2, j = 0; i <= lb; i++) {
while (j > 0 && b[i] != b[j + 1]) j = Next[j];
if (b[i] == b[j + 1]) j++;
Next[i] = j;
}
for (int i = 1, j = 0; i <= la; i++) {
while (j > 0 && (j == lb || a[i] != b[j + 1])) j = Next[j];
if (a[i] == b[j + 1]) j++;
F[i] = j;
if (j == lb) cout << i - lb + 1 << endl;
}
}
其中,如果j是Next[i]的“候选项”,那么Next[i]下一个“候选项”一定是Next[j]。这是因为下一个“候选项”首先要与j匹配,才有可能与i匹配。而满足这一性质的最大值为Next[j]。
再来看这道题。首先,如果i-len就是Next[i]的候选项,那么显然len有可能是循环节。说明充分性:i-len就是Next[i]的候选项,即str[i…len-1]=str[len+1…i]。取两个子串前len个字符,显然也相等。
还有一点,一个子串一定要出现两次以上才能被称作“循环节”,因此在满足整除的条件下,还要保证当前串长度除以要检查的子串长度大于1。
Code
#include <bits/stdc++.h>
using namespace std;
const int MAX_N = 1000000 + 10;
int Next[MAX_N], n, t;
char str[MAX_N];
int main() {
scanf("%d", &t);
for (int k = 1; k <= t; k++) {
scanf("%d%s", &n, str + 1);
printf("Test case #%d\n", k);
Next[1] = 0;
for (int i = 2, j = 0; i <= n; i++) {
while (j > 0 && str[i] != str[j + 1]) j = Next[j];
if (str[i] == str[j + 1]) j++;
Next[i] = j;
}
for (int i = 1; i <= n; i++) {
if (i % (i - Next[i]) == 0 && i / (i - Next[i]) > 1)
// 子串一定要出现两次以上才能被称作“循环节”
printf("%d %d\n", i, i / (i - Next[i]));
}
}
return 0;
}
Reference
《算法竞赛进阶指南》p.69