题目
题目描述
给定若干个长度 ≤ 1 0 6 \le 10^6 ≤106的字符串,询问每个字符串最多是由多少个相同的子字符串重复连接而成的。如:ababab 则最多有 3 个 ab 连接而成。
输入格式
输入若干行,每行有一个字符串。特别的,字符串可能为 . 即一个半角句号,此时输入结束。
样例
样例输入
abcd
aaaa
ababab
.
样例输出
1
4
3
代码详解
哈希
ACcode
#include<bits/stdc++.h>
using namespace std;
#define ull unsigned long long
const int M=1e7+7;
char s[M];
ull l;
ull b=1311;
ull h[M];
inline ull ksm(ull);
inline void H();
inline ull H_p(ull,ull);
inline bool check(ull,ull);
int main()
{
scanf("%s",s+1);
while(s[1]!='.'){
l=strlen(s+1);
H();
for(ull i=1;i<=l;i++){
if(l%i==0){
ull ha=h[i];
if(check(ha,i)){
cout<<l/i<<endl;
break;
}
}
}
scanf("%s",s+1);
}
return 0;
}
inline ull ksm(ull k){
if(k==0){
return 1;
}
if(k==1){
return b;
}
ull tmp=ksm(k/2);
tmp*=tmp;
if(k%2){
tmp*=b;
}
return tmp;
}
inline void H(){
h[0]=0;
for(ull i=1;i<=l;i++){
h[i]=h[i-1]*b+(ull)(s[i]-'A'+1);
}
}
inline ull H_p(ull k,ull n){
return h[k+n]-h[k]*ksm(n);
}
inline bool check(ull h,ull len){
for(ull i=len;i<=l-len;i+=len){
if(h!=H_p(i,len)){
return false;
}
}
return true;
}
思路
只需要遍历可能的长度,然后check一下当前长度即可
输入
scanf("%s",s+1);
while(s[1]!='.'){
...
scanf("%s",s+1);
}
这里我在外面输入,输入后进入while循环判断一下是否需要停止
再在while循环的最后输入一次
至于为什么s+1,是为了让s字符数组从下标1开始读入
看着好看 方便做题
手打Hash
inline void H(){
h[0]=0;
for(ull i=1;i<=l;i++){
h[i]=h[i-1]*b+(ull)(s[i]-'A'+1);
}
}
inline ull H_p(ull k,ull n){
return h[k+n]-h[k]*ksm(n);
}
H类似于初始化函数,即给h数组赋值
H_p函数返回ull类型的子串哈希值
在通过函数来手写Hash之后,我们会发现在写代码的时候会畅通无阻
代码的可读性也直线上升
check函数
inline bool check(ull h,ull len){
for(ull i=len;i<=l-len;i+=len){
if(h!=H_p(i,len)){
return false;
}
}
return true;
}
判断当前选择的子串的哈希值是否符合题意
即以当前的长度len把s分成若干份,把每一个子串的哈希值与第一个子串的哈希值作比较,若有一个子串的哈希值与第一个子串的哈希值不相等,那么就直接break掉
快速幂
inline ull ksm(ull k){
if(k==0){
return 1;
}
if(k==1){
return b;
}
ull tmp=ksm(k/2);
tmp*=tmp;
if(k%2){
tmp*=b;
}
return tmp;
}
相信读者能够读明白快速幂的代码,笔者在这里不做赘述
有兴趣的读者可以搜索有关资料
KMP
#include<bits/stdc++.h>
using namespace std;
const int N=1e7;
char a[N];
int p[N];
int n;
void pre(){
p[1]=0;
int j=0;
for(int i=1;i<n;i++){
while(j>0&&a[j+1]!=a[i+1]){
j=p[j];
}
if(a[j+1]==a[i+1]){
j++;
}
p[i+1]=j;
}
}
int main()
{
while(cin>>a+1){
n=strlen(a+1);
if(a[1]=='.'){
break;
}
pre();//运算p数组
if(n%(n-p[n])==0){//若有多个子串
printf("%d\n",n/(n-p[n]));
}
else{//否则只有一个
printf("1\n");
}
}
return 0;
}