HDU 6194 string string string(后缀数组+ST)

22 篇文章 0 订阅
15 篇文章 0 订阅

Description

给出一个字符串 s s ,定义s的子串中恰好出现 k k 次的子串为重要子串,问s的重要子串个数

Input

第一行一整数 T T 表示用例组数,每组用例首先输入一整数k,之后输入一字符串 s s

(1T100,k1,|s|105)

Output

输出 s s 的重要子串个数

Sample Input

2
2
abcabc
3
abcabcabcabc

Sample Output

6
9

Solution

子串是后缀的前缀,相同的子串必然为字典序相邻后缀的公共前缀,故先跑一边后缀数组得到height数组, height[i] h e i g h t [ i ] 表示字典序第 i1 i − 1 小的后缀和第 i i 小的后缀的最长公共前缀长度

k>1时,考虑字典序第 i i 小的后缀到字典序第i+k1小的后缀,这 k k 个后缀的公共前缀长度为x=min(height[j]),i+1ji+k1,公共前缀的前 x x 个前缀即为在s中出现至少 k k 次的子串,但是注意到要出现恰好k次,故这 x x 个前缀并不都合法,其中是字典序第i1小的后缀和字典序第 i+k i + k 小的后缀的前缀的前缀是不合法的,故答案为 xmax(height[i],height[i+k]) x − m a x ( h e i g h t [ i ] , h e i g h t [ i + k ] )

k=1 k = 1 时,问题即转化为在 s s 中恰好出现一次的子串数量,也即总后缀数n(n+1)2减去在 s s 中重复出现的子串数,对于字典序第i小的后缀,其不合法前缀即为和字典序第 i1 i − 1 小的后缀的公共前缀,以及和字典序第 i+1 i + 1 小的后缀的公共前缀,故其不合法前缀数为 max(height[i],height[i+1]) m a x ( h e i g h t [ i ] , h e i g h t [ i + 1 ] ) ,对每个后缀累加其不合法前缀数即为重复出现的子串数

Code

#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<vector>
#include<queue>
#include<map>
#include<set>
#include<ctime>
using namespace std;
typedef long long ll;
typedef pair<int,int>P;
const int INF=0x3f3f3f3f,maxn=100005;
int t1[maxn],t2[maxn],sa[maxn],c[maxn],Rank[maxn],height[maxn];
bool cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int n,int m)
{
    n++;
    int i,j,p,*x=t1,*y=t2;
    for(i=0;i<m;i++)c[i]=0;
    for(i=0;i<n;i++)c[x[i]=str[i]]++;
    for(i=1;i<m;i++)c[i]+=c[i-1];
    for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
    for(j=1;j<=n;j<<=1)
    {
        p=0;
        for(i=n-j;i<n;i++)y[p++]=i;
        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
        for(i=0;i<m;i++)c[i]=0;
        for(i=0;i<n;i++)c[x[y[i]]]++;
        for(i=1;i<m;i++)c[i]+=c[i-1];
        for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1;x[sa[0]]=0;
        for(i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        if(p>=n)break;
        m=p;
    }
    int k=0;
    n--;
    for(i=0;i<=n;i++)Rank[sa[i]]=i;
        for(i=0;i<n;i++)
        {
            if(k)k--;
            j=sa[Rank[i]-1];
            while(str[i+k]==str[j+k])k++;
            height[Rank[i]]=k;
        }
}
int RMQ[maxn],mm[maxn],best[22][maxn];
void Init_rmq(int n)
{
    for(int i=1;i<=n;i++)RMQ[i]=height[i];
    mm[0]=-1;
    for(int i=1;i<=n;i++)
        mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1];
    for(int i=1;i<=n;i++)best[0][i]=i;
    for(int i=1;i<=mm[n];i++)
        for(int j=1;j+(1<<i)-1<=n;j++)
        {
            int a=best[i-1][j];
            int b=best[i-1][j+(1<<(i-1))];
            if(RMQ[a]<RMQ[b])best[i][j]=a;
            else best[i][j]=b;
        }
}
int Ask_rmq(int a,int b)
{
    int t;
    t=mm[b-a+1];
    b-=(1<<t)-1;
    a=best[t][a];b=best[t][b];
    return RMQ[a]<RMQ[b]?a:b;
}
int T,k,a[maxn];
char s[maxn];
int main()
{
    scanf("%d",&T);
    while(T--)
    {
        scanf("%d %s",&k,s);
        int n=strlen(s);
        for(int i=0;i<n;i++)a[i]=s[i];
        a[n]=0;
        da(a,n,128);
        height[n+1]=0;
        Init_rmq(n);
        ll ans=0;
        if(k!=1)
        {
            for(int i=1;i<=n-k+1;i++)
            {
                int Min=height[Ask_rmq(i+1,i+k-1)];
                ans+=max(0,Min-max(height[i],height[i+k]));
            }
        }
        else
        {
            ans=(ll)n*(n+1)/2;
            for(int i=1;i<=n;i++)ans-=max(height[i],height[i+1]);
        }
        printf("%I64d\n",ans);
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值