bzoj3473

36 篇文章 0 订阅
9 篇文章 0 订阅

http://www.elijahqi.win/archives/607
Description

给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串?
Input

第一行两个整数n,k。
接下来n行每行一个字符串。
Output

一行n个整数,第i个整数表示第i个字符串的答案。
Sample Input

3 1
abc
a
ab
Sample Output

6 1 3
HINT

对于 100% 的数据,1<=n,k<=10^5,所有字符串总长不超过10^5,字符串只包含小写字母。

Source

Adera 1 杯冬令营模拟赛

首先这个题目我确实是读了很久才读懂的x

分别询问这n个字符串每一个字符串的子串至少在其他k个字符串中出现 的个数

由于求每个的贡献,所以不妨我们枚举每个后缀然后在每个后缀里再枚举所有前缀,这样就可以不重不漏的枚举所有子串了

为了款苏查找判断这个区间内是否有k个及以上的不同串。我们预处理一个L数组,表示L[i]…i区间内有k个及以上的不同串且L[i]最大。(也就是使以i为右端点的区间满足条件的最小区间)显然这是可以一遍O(n)扫描完成的。(用一个指针p表示左端点的移动)。则只需看[l…r]区间是否包含了[L[r]…r]区间即可快速判断。 这个区间指的是sa的区间就是按照顺序排好的后缀

我们记录每个串在总串中从data[i].st开始data[i].ed结束

假设我们在求a[j…ed]这个后缀的贡献。则他的贡献就是有几个前缀出现在k个及以上不同串中,显然如果a[j..j+len-1]满足且len最大,则对答案的贡献为len。我们只需求出这个最大的len。考虑到如果a[j-1…ed]对答案的贡献为len,则a[j…ed]对答案的贡献至少为len-1,<—(由此)我们可以像求height数组那样来求这个贡献。

还需要实现的是如何判断a[j…j+len-1](以下记作串t)是否出现在k个及以上不同的串中。首先根据h数组我们可以求出最大的区间[l..r]满足这r-l+1个后缀均包含串t。我们统计这个区间内是否有k个及以上的不同串。

#include<cstdio>
#include<cstring>
#define N 220000
int m,nn,n1,k,n,kk;
int a[N],rank[N<<1],rank1[N],sa[N],tmp[N],count[N],height[N],fmin[N][20];
int bl[N],cnt[N],L[N],Log[N];
char str1[N];
struct node{
    int st,ed;
}data[N>>1];
inline int min(int x,int y){return x<y?x:y; }
inline int lcp(int x,int y){
    x++;int t=y-x+1;t=Log[t];
    return min(fmin[x][t],fmin[y-(1<<t)+1][t]);
}
bool check(int st,int len){ //串sa[st]->sa[st+len-1]是否满足题目的条件 
    int l1,r1;//二分的目标是找到最大的sa区间,使包含sa[st]..sa[st]+len-1 
    if (height[st]<len) l1=st;else{
        int l=1,r=st-1;
        while (l<=r){
            int mid=(l+r)>>1;
            if(lcp(mid,st)>=len) r=mid-1;else l=mid+1;
        }
        l1=l;
    }
    if (height[st+1]<len) r1=st;else{
        int l=st+1,r=n;
        while (l<=r){
            int mid=(l+r)>>1;
            if (lcp(st,mid)>=len) l=mid+1;else r=mid-1;
        }
        r1=r;
    } 
    return L[r1]>=l1;//L[r1]到r1的区间肯定包含了kk及以上不同的字串,判断l1->r1的区间能否包含 
}
int main(){
    freopen("bzoj3473.in","r",stdin);
    scanf("%d%d",&n1,&kk);
    m=30;n=1;
    for (int i=1;i<=n1;++i){
        scanf("%s",str1);nn=strlen(str1);data[i].st=n;
        for (int j=0;j<nn;++j) a[j+n]=str1[j]-'a'+1,bl[j+n]=i;
        n+=nn;data[i].ed=n-1;a[n++]=m++;
    }n-=1;
//  for (int i=1;i<=n1;++i) printf("%d %d\n",data[i].st,data[i].ed);
//  for (int i=1;i<=n;++i) printf("%d ",a[i]);  
    for (int i=1;i<=n;++i) count[a[i]]=1;
    for (int i=1;i<=n+255;++i) count[i]+=count[i-1];
    for (int i=1;i<=n;++i) rank[i]=count[a[i]];
    for (int p=1;k!=n;p<<=1,m=k){
        for (int i=1;i<=m;++i) count[i]=0;
        for (int i=1;i<=n;++i) count[rank[i+p]]++;
        for (int i=1;i<=m;++i) count[i]+=count[i-1];
        for (int i=n;i>=1;--i) tmp[count[rank[i+p]]--]=i;
        for (int i=1;i<=m;++i) count[i]=0;
        for (int i=1;i<=n;++i) count[rank[i]]++;
        for (int i=1;i<=m;++i) count[i]+=count[i-1];
        for (int i=n;i>=1;--i) sa[count[rank[tmp[i]]]--]=tmp[i];
        memcpy(rank1,rank,sizeof(rank)>>1);
        rank[sa[1]]=k=1;
        for (int i=2;i<=n;++i){
            if (rank1[sa[i]]!=rank1[sa[i-1]]||rank1[sa[i]+p]!=rank1[sa[i-1]+p]) ++k;
            rank[sa[i]]=k;
        }
    }
/*  for (int i=1;i<=n;++i){
        for (int j=sa[i];j<=n;++j) printf("%c",a[j]+'a'-1);printf("\n");
    }*/
    //for (int i=1;i<=n;++i) printf("%d ",rank[i]);printf("\n");
    k=0;
    for (int i=1;i<=n;++i){
        if (rank[i]==1) continue;
        k=k==0?0:k-1;
        while (a[i+k]==a[sa[rank[i]-1]+k]) ++k;
        height[rank[i]]=k;
    }
    //for (int i=1;i<=n;++i) printf("%d ",height[i]);
    Log[0]=-1;
    for (int i=1;i<=n;++i) Log[i]=Log[i>>1]+1;
//  for (int i=1;i<=n;++i) printf("%d ",Log[i]);
    for (int i=1;i<=n;++i) fmin[i][0]=height[i];
    for (int j=1;j<=Log[n];++j){
        for (int i=1;i<=n-(1<<j)+1;++i){
            fmin[i][j]=min(fmin[i][j-1],fmin[i+(1<<(j-1))][j-1]);
        }
    }
    //o(n)求l数组
    int num=0;
    for (int i=1,p=1;i<=n;++i){
        if (!bl[sa[i]])break;//因为前面的设定,如果遇到分隔符,自动退出 
        if (cnt[bl[sa[i]]]==0) num++;//如果不存在这一块 则计数器+1
        cnt[bl[sa[i]]]++;
        while (num>kk||num==kk&&cnt[bl[sa[p]]]>1){
            --cnt[bl[sa[p]]];if(cnt[bl[sa[p++]]]==0) num--;
        } 
        if(num>=kk) L[i]=p;else L[i]=-1;
    } 
    //for (int i=1;i<=n;++i) printf("%d ",L[i]);
    for (int i=1;i<=n1;++i){
        long long ans=0;int k=0;
        for (int j=data[i].st;j<=data[i].ed;++j){
            k=k==0?0:k-1;
            while (j+k<=data[i].ed&&check(rank[j],k+1)) ++k;//检查一下rank[j]这个后缀是否满足k+1这个长度的条件 
            ans+=k;
        }
        printf("%lld",ans);if (i!=n1) printf(" ");
    }
    return 0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值