题意:给一个字符串S长度不超过10^6,求最大的n使得S由n个相同的字符串a连接而成,如:"ababab"则由n=3个"ab"连接而成,"aaaa"由n=4个"a"连接而成,"abcd"则由n=1个"abcd"连接而成。
定理:假设S的长度为len,则S存在循环子串,当且仅当,len可以被len - next[len]整除,最短循环子串为S[len -
next[len]]
例子证明: 设S=q1q2q3q4q5q6q7q8,并设next[8] = 6,此时str = S[len - next[len]] =
q1q2,由字符串特征向量next的定义可知,q1q2q3q4q5q6 =
q3q4q5q6q7q8,即有q1q2=q3q4,q3q4=q5q6,q5q6=q7q8,即q1q2为循环子串,且易知为最短循环子串。由以上过程可知,若len可以被len
- next[len]整除,则S存在循环子串,否则不存在。
解法:利用KMP算法,求字符串的特征向量next,若len可以被len - next[len]整除,则最大循环次数n为len/(len - next[len]),否则为1。
转载自POJ 2406 Power Strings(KMP)
#include<stdio.h>
#include<string.h>
int next[1000000];
void get_next(char *s,int len)
{
int i=0;
int j=-1;
next[0]=-1;
while(i<len)
{
if(j==-1||s[i]==s[j])
{
i++;
j++;
if(s[i]!=s[j])
next[i]=j;
else
next[i]=next[j];
}
else
j=next[j];
}
}
int main()
{
char a[1000000];
int lenth;
while(~scanf("%s",a)&&a[0]!='.')
{
lenth=strlen(a);
get_next(a,lenth);
if(lenth%(lenth-next[lenth])==0)
printf("%d\n",lenth/(lenth-next[lenth]));
else
printf("1\n");
memset(next,0,sizeof(next));
}
return 0;
}