题目描述
给定若干个长度 ≤ 1000000 的字符串,询问每个字符串最多是由多少个相同的子字符串重复连接而成的。如:ababab 则最多有 3 个 ab 连接而成。
输入格式
输入若干行,每行有一个字符串,字符串仅含英语字母。
输入数据以"."结束。
输出格式
对于每组输入数据输出一行,找出每个字符串最多是由多少个相同的子字符串重复连接而成的。
样例输入
abcd
aaaa
ababab
.
样例输出
1
4
3
思路:这个题目正确的做法好像是后缀数组,但是也可以用哈希做,将字符串转换为哈希值,然后就可以O(1)的时间比较两个字符串是否相等,所以直接暴力枚举由多少个相同的子字符串构成该字符串就可以了。
代码:
#include<stdio.h>
#include<iostream>
#include<string.h>
#include<string>
#define LL long long
#define ULL unsigned long long
#define Max 1000005
const ULL base=131;
const LL mod=1e9+7;
const LL LL_MAX=9223372036854775807;
using namespace std;
ULL Hash[Max],p[Max];
char str[Max];
inline void getHash(){//一定要加inline,否则会超时
p[0]=(ULL)1;
int len=strlen(str+1);
for(int i=1;i<=len;i++)
Hash[i]=Hash[i-1]*base+str[i],p[i]=p[i-1]*base;//计算哈希值,顺便打表base的i次方
}
inline ULL getHashRange(int l,int r){
return Hash[r]-Hash[l-1]*p[r-l+1];
}
inline bool check(int d){
int len=strlen(str+1);
if(len%d)//如果不能取余肯定不能构成
return false;
int dis=len/d;
ULL t=getHashRange(1,dis);
for(int i=2*dis;i<=len;i+=dis){
ULL tt=getHashRange(i-dis+1,i);
if(tt!=t)
return false;
}
return true;
}
int main()
{
while(scanf("%s",str+1)==1 && str[1]!='.'){
int ans=0,len=strlen(str+1);
getHash();
for(int i=len;i>=1;i--){
if(check(i)){
ans=i;
break;
}
}
printf("%d\n",ans);
}
return 0;
}