2021杭电多校第八场 HDU7064-Singing Superstar(哈希)

传送门

题意:

给出一个长度为 1 e 5 1e5 1e5的字符串和 n ( n < = 1 e 5 ) n(n<=1e5) n(n<=1e5)个长度 < = 30 <=30 <=30的子串,求每个子串在模式串中的最大不相交出现次数;

思路:

  • 大概是 A C AC AC自动机模板题?
  • 下面说一下哈希的做法:
  • 有一个很重要的地方就是子串的长度是 < = 30 <=30 <=30的,也就是说我们完全可以枚举模式串中长度为 [ 1 , 30 ] [1,30] [1,30]的字符串,通过比较哈希值来看这段字符串是不是子串,时间复杂度大概 O ( 30 n ) O(30n) O(30n)
  • 这样没有办法处理的问题就是如何保证不相交了。
  • l a s [ x ] las[x] las[x]表示哈希值为 x x x的字符串在模式串中的上一个出现位置(记录的是尾端字符所在的位置)。比如 a b a b a b ababab ababab,当枚举到 i = = 1 i==1 i==1的时候,子串为 a b , l a s [ ′ a b ′ ] = 2 ab,las['ab']=2 ablas[ab]=2
  • 这样每次遍历的时候,只需要判断 l a s [ n o w ] < i las[now]<i las[now]<i是否成立就好了;
  • 简单说一下正确性,这样处理的目的是避免相交的子串,但是怎么能够保证这样是最优的呢?
  • 如果有某个子串出现了奇数次,比如 b a b a b a b bababab bababab,其中 b a b bab bab出现了 3 3 3次,按照上述算法,中间的 b a b bab bab会被忽略掉,最后答案为 2 2 2次;
  • 如果有某个子串出现了偶数次,比如 b a b a b a b a b babababab babababab,其中 b a b bab bab出现了 4 4 4次,按照上述算法,第二个和第四个的 b a b bab bab会被忽略掉,最后答案为 2 2 2次;
  • 这两种都是最优的。

代码:

const int N=4e5+7,P=131;

ull h[N], p[N],a[N]; 
char str[N];
ull th[50],tp[50];
ull get(int l, int r)
{
    return h[r]-h[l-1]*p[r-l+1];
}

int main(){
    int _=read;
    while(_--){
        scanf("%s",str+1);
        p[0]=1;h[0]=0;
        int len=strlen(str+1);
        for(int i=1;i<=len;i++){
             h[i] = h[i - 1] * P + str[i];
             p[i] = p[i - 1] * P;
             //cout<<h[i]<<endl;
        }
        unordered_map<ull,int>mp,las;
        int n=read;
        rep(i,1,n){
            char s[35];cin>>s+1;
            tp[0]=1;th[0]=0;
            for(int j=1;j<=strlen(s+1);j++){
                th[j]=th[j-1]*P+s[j];
                tp[j]=tp[j-1]*P;
            }
            a[i]=th[strlen(s+1)];
            mp[a[i]]=0;
            las[a[i]]=0;
            //cout<<a[i]<<endl;
        }
        for(int i=1;i<=len;i++){
            for(int j=0;j<30&&i+j<=len;j++){
                ull now=get(i,i+j);
                //if(i==1&&j==2) cout<<now<<endl;
                if(mp.count(now)){
                    if(las[now]<i) mp[now]++,las[now]=i+j;
                }
            }
        }
        rep(i,1,n) printf("%d\n",mp[a[i]]);
    }
    return 0;
}

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

豆沙睡不醒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值