POJ2406 power strings——哈希/KMP

题目传送门
题目大意:
给定若干个长度 ≤ 106 10 6 的字符串,询问每个字符串最多是由多少个相同的子字符串重复连接而成的。如: ababab a b a b a b 则最多有 3 3 ab 连接而成。

样例输入:
abcd
aaaa
ababab
. //当读入为.时结束程序
样例输出
1
4
3


这道题是一道有趣的题,有两种思路,第一种是哈希。
我们考虑哈希的过程,就以 ababab a b a b a b 为例,则整个串的哈希值为(我的乘数是233)
233(233(233(233(233a+b)+a)+b)+a)+b 233 ∗ ( 233 ∗ ( 233 ∗ ( 233 ∗ ( 233 ∗ a + b ) + a ) + b ) + a ) + b
这是最基础的哈希过程,我们把它拆开,就成了下式:
(a2335+b2334)+(a2333+b2332)+(a233+b) ( a ∗ 233 5 + b ∗ 233 4 ) + ( a ∗ 233 3 + b ∗ 233 2 ) + ( a ∗ 233 + b )
我们考虑 ab a b 的哈希值,为 a233+b a ∗ 233 + b ,设 ab a b 的哈希值为 x x ,则整个串的哈希值为x2334+x2332+x2330
其实就是 x x 乘以一个等比数列,而这个数列为1,233l,2332l233Ll其中 l l 为我们要求的字串的长度,L为大串的长度,根据等比数列公式,这个数列的和是 1pL1pl 1 − p L 1 − p l ,所以枚举 l l ,并求出当前串的哈希值,如果其乘以左边的数等于大串的哈希值,那么我们要找的就是这个字串。(由于pl会很大,所以这道题要使用乘法逆元)

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#define MD 1000000007
#define ll long long
using namespace std;
char s[1000005];
ll l,a,b,lst,bin[1000005];
ll pows(ll a,ll b){
    ll base=1;
    while(b){
        if(b&1) base=base*a%MD;
        a=a*a%MD;b/=2;
    }
    return base;
}
int main()
{
    bin[0]=1;
    for(ll i=1;i<=1000000;i++) bin[i]=bin[i-1]*233%MD;
    while(~scanf("%s",s+1)){
        if(s[1]=='.') break;
        l=strlen(s+1);lst=0;a=0;b=0;
        for(ll i=1;i<=l;i++) a=(a*233+s[i])%MD;
        for(ll i=l;i>=1;i--){
            if(l%i) continue;
            for(ll j=lst+1;j<=l/i;j++) b=(b*233+s[j])%MD;lst=(l/i);
            ll x=b;x=x*(bin[l]-1+MD)%MD;
            x=x*pows(bin[l/i]-1,MD-2)%MD;
            if(x==a){
                printf("%d\n",i);break;
            }
        }
    }
    return 0;
}

第二种方法十分巧妙,运用的是KMP算法。首先我们求出这个字符串的 next n e x t 。我们考虑 next n e x t 的性质,如果一个长为 L L 字符串被一个小字符串分成m条,那么它的 next n e x t 是多少? Lm1m L ∗ m − 1 m ,我们因为 next n e x t 是它最长的不等于自己的相同的前缀和后缀。因为不等于自己,又要最长,所以只能乘以 m1m m − 1 m ,所以如果真的能被分成 m m 条,那么Lnxt[L]整除 L L ,并且答案就是LLnxt[L]

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
char s[1000005];
int nxt[1000005],l;
void getnext(){
    int k=-1,j=0;
    nxt[0]=-1;
    while(j<l){
        if(k==-1||s[k]==s[j]){
            k++;j++;
            nxt[j]=k;
        }
        else k=nxt[k];
    }
}
int main()
{
    while(~scanf("%s",s)){
        if(s[0]=='.') break;
        l=strlen(s);
        getnext();
        printf("%d\n",l%(l-nxt[l])?1:l/(l-nxt[l]));
    }
    return 0;
}
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值