BZOJ 3277 串(后缀数组+线段树)

题目链接:BZOJ 3277

题目大意:
给出n个字符串,询问每个字符串中有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串。(n,k<=100000,n个串总长<=100000)

题解:
子串是后缀的前缀。某一个字符串id的答案就是id所有后缀的 最长的 出现在k个串中的 前缀 长度的和。
把n个串拼在一起,中间用不同的、没有出现过的字符隔开,求一遍SA[]和height[]。考虑到一段后缀出现k次的最长前缀长度就是一段区间height[]的最小值,就可以按SA枚举一个区间的右端点,每次移动左端点保证这个区间包含k个不同的字符串,这个区间的贡献就是min{Height[l+1~r]} ,然后用线段树维护。

code(有参考dalao的BLOG)

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#define N 200005
using namespace std;
inline int read()
{
    char c=getchar(); int num=0,f=1;
    while (c<'0'||c>'9') { if (c=='-') f=-1; c=getchar(); }
    while (c<='9'&&c>='0') { num=num*10+c-'0'; c=getchar(); }
    return num*f;
}
int n,m=255,Q,k,ret,SA[N],rnk[N],height[N],tp[N],tax[N];
int s[N],rmq[N][25],tot[N],ans[N],fr[N],mn[N<<2];
char str[N];
void Rsort()
{
    for (int i=0;i<=m;i++) tax[i]=0;
    for (int i=1;i<=n;i++) tax[rnk[tp[i]]]++;
    for (int i=1;i<=m;i++) tax[i]+=tax[i-1];
    for (int i=n;i>=1;i--) SA[tax[rnk[tp[i]]]--]=tp[i];
}
bool cmp(int *f,int x,int y,int w)
{
    return f[x]==f[y]&&f[x+w]==f[y+w];
}
void suffix_array()
{
    for (int i=1;i<=n;i++) rnk[i]=s[i],tp[i]=i;
    Rsort();
    for (int w=1,p=1;p<n;w+=w,m=p)
    {
        p=0;
        for (int i=n-w+1;i<=n;i++) tp[++p]=i;
        for (int i=1;i<=n;i++) if (SA[i]>w) tp[++p]=SA[i]-w;
        Rsort(); swap(rnk,tp); rnk[SA[1]]=p=1;
        for (int i=2;i<=n;i++)
         rnk[SA[i]]=cmp(tp,SA[i],SA[i-1],w)?p:++p;
    }
    for (int i=1,k=0;i<=n;i++)
    {
        if (k) k--;
        int j=SA[rnk[i]-1];
        while (s[i+k]==s[j+k]) k++;
        height[rnk[i]]=k;
    }
}
int find(int l,int r)
{
    int j=log(r-l+1)/log(2);
    return min(rmq[l][j],rmq[r-(1<<j)+1][j]);
}
void RMQ()
{
    for (int i=1;i<=n;i++) rmq[i][0]=height[i];
    for (int j=1;j<20;j++)
     for (int i=1;i<=n;i++)
     {
        if (i+(1<<(j-1))>n) rmq[i][j]=rmq[i][j-1];
         else rmq[i][j]=min(rmq[i][j-1],rmq[i+(1<<(j-1))][j-1]);
     }
}
void change(int now,int l,int r,int begin,int end,int val)
{
    if (begin<=l&&r<=end)
    {
        mn[now]=max(mn[now],val); return;
    }
    int mid=l+r>>1;
    if (begin<=mid) change(now<<1,l,mid,begin,end,val);
    if (end>mid) change(now<<1|1,mid+1,r,begin,end,val);
}
void query(int now,int l,int r,int pos)
{
    ret=max(ret,mn[now]);
    if (l==r) return;
    int mid=l+r>>1; 
    if (pos<=mid) query(now<<1,l,mid,pos);
     else query(now<<1|1,mid+1,r,pos);
}
int main()
{
    Q=read(); k=read();
    int last=255;
    for (int i=1;i<=Q;i++)
    {
        scanf("%s",str+1);
        int l=strlen(str+1);
        if (k==1) ans[i]=l*(l+1)/2;
        if (last=='a'-1) last='z';
        if (n) s[++n]=++last;
        for (int j=1;j<=l;j++) s[++n]=str[j],fr[n]=i;
    }
    if (k==1)
    {
        for (int i=1;i<=Q;i++) printf("%d ",ans[i]);
        return 0;
    }
    m=max(m,last);
    suffix_array(); 
    RMQ();
    int l=1;
    for (int r=1;r<=n;r++)
    {
        if (fr[SA[r]]) tot[fr[SA[r]]]++;
        if (fr[SA[r]]&&tot[fr[SA[r]]]==1) tot[0]++;
        if (tot[0]<k) continue;
        while (l<r&&tot[0]>k)
        {
            tot[fr[SA[l]]]--;
            if (!tot[fr[SA[l]]]) tot[0]--;
            l++;
        }
        while (l<r&&tot[0]==k)
        {
            if (tot[0]==k) change(1,1,n,l,r,find(l+1,r));
            tot[fr[SA[l]]]--;
            if (!tot[fr[SA[l]]]) { tot[fr[SA[l]]]++; break; }
            l++;
        }
        if (tot[0]==k) change(1,1,n,l,r,find(l+1,r));
    }
    for (int i=1;i<=n;i++)
    {
        ret=0;
        query(1,1,n,i);
        ans[fr[SA[i]]]+=ret;
    }
    for (int i=1;i<=Q;i++) printf("%d ",ans[i]);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值