BZOJ 4566: [Haoi2016]找相同字符(后缀数组的两种做法)

题目

原题链接
有两个字符串,询问有多少个相同的子串。
两个字符串长度<=2e5

分析

后缀数组/后缀自动机裸题,不过我暂时只会后缀数组。

然而我做了一上午。。。。

我觉得有很大一个问题就是网上有两种题解,然而我没有意识到这两个算法不一样,所以搞混得挺惨的,关键是这两个方法都是用单调栈在维护哎。。

首先这道题暴力做法是两两枚举来自不同串所有后缀,它们对答案的贡献就是他们的LCP,可以做到O(n^3)或者O(n^2),看你用不用ST表了。

然后优化。

方法一:
我们考虑如何快速求出一个后缀和它前面的所有另一个子串的后缀的LCP和(只求前面才不会重复)

考虑当前height[i],前面的某个后缀j的min{hight[j]~hight[i]}的值比当前hight[i]大,那么它们对答案的贡献都会减少成hight[i],所以把前面所有height值比当前大的元素全部取出,和当前height合并,更新答案。

最终栈里面的元素要记录min{height},a串的后缀个数和b串的后缀个数,还要维护一个全局变量作为前缀和。具体见代码。

方法二:
考虑对于两个后缀height[i]~height[j],它们的贡献是i~j之间height最小的值。

对于每一个height,我们都预处理出它左边多少个元素height都比它大,右边多少个元素height都比它大。然后左边任选一个元素和右边任选一个元素的LCP最小值当时当前hight,用乘法原理计算贡献即可。

但是要注意下标的细节,还有就是如果两个height一样可能会算重,所以改成左边第一个大于等于当前height的下标,右边第一个大于当前元素的下标。这样不会算重,画一下图发现是对的,要感性地想一下的话可以看做对于右边这一段最多可以和左边匹配到哪里,每次都充分考虑了右边这一段的匹配情况并且不重不漏。

综上,两个方法其实差不多,但是第二个方法稍微绕一点,不过感觉是个很有意思的算法。时间复杂度都是O(n),但是预处理后缀数组的时间复杂度是O(nlogn)

代码

方法一

#include<cmath>
#include<queue>
#include<cctype>
#include<cstdio>
#include<vector>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
typedef long long LL;
const int maxn=4e5+105;
int n,n1,n2;
char s[maxn];
int sa[maxn],t[maxn<<1],t2[maxn<<1],c[200],height[maxn],rank[maxn];
void get_sa(int n,int m)
{
    int i,*x=t,*y=t2;
    for(i=1;i<=m;i++)c[i]=0;
    for(i=1;i<=n;i++)c[x[i]=s[i]]++;
    for(int i=2;i<=m;i++)c[i]+=c[i-1];
    for(i=n;i;i--)sa[c[x[i]]--]=i;
    for(int k=1;k<=n;k<<=1)
    {
        int num=0;
        for(i=n-k+1;i<=n;i++)y[++num]=i;
        for(i=1;i<=n;i++)if(sa[i]>k)y[++num]=sa[i]-k;
        for(i=1;i<=m;i++)c[i]=0;
        for(i=1;i<=n;i++)c[x[i]]++;
        for(i=2;i<=m;i++)c[i]+=c[i-1];
        for(i=n;i;i--)sa[c[x[y[i]]]--]=y[i];
        swap(x,y);
        x[sa[1]]=1;num=1;
        for(int i=2;i<=n;i++)
            x[sa[i]]=(y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
        if(num==n)break;
        m=num;
    }
}
void getHeight()
{
    int k=0;
    for(int i=1;i<=n;i++)rank[sa[i]]=i;
    for(int i=1;i<=n;i++)
    {
        if(rank[i]==1)continue;
        if(k)k--;
        int j=sa[rank[i]-1];
        while(j+k<=n && i+k<=n && s[i+k]==s[j+k])k++;
        height[rank[i]]=k;
    }
}
void Init()
{
    scanf("%s",s+1);
    n1=strlen(s+1);
    s[n1+1]='z'+1;
    scanf("%s",s+n1+2);
    n2=strlen(s+n1+2);
    n=n1+n2+1;
    get_sa(n,'z'+2);
    getHeight();
}
int l[maxn],r[maxn];
struct data{
    int d,a,b;
    friend data operator+(data a,data b)
    {
        return (data){a.d,a.a+b.a,a.b+b.b};
    }
    friend bool operator<(data a,data b)
    {
        return a.d<b.d;
    }
}stk[maxn],now;
int top;
void solve()
{
    LL ans=0,nowa=0,nowb=0;
    for(int i=2;i<=n;i++)
    {
        now.d=height[i],now.a=now.b=0;
        if(sa[i-1]<=n1)now.a++;
        if(sa[i-1]>n1+1)now.b++;
        while(top && now<stk[top])
        {
            nowa-=stk[top].a*stk[top].d;
            nowb-=stk[top].b*stk[top].d;
            now=now+stk[top--];
        }
        stk[++top]=now;
        nowa+=now.a*now.d;
        nowb+=now.b*now.d;
        if(sa[i]<=n1)ans+=nowb;
        if(sa[i]>n1+1)ans+=nowa;
    }
    cout<<ans<<endl;
}
int main()
{
    //freopen("in.txt","r",stdin);
    Init();
    solve();
    return 0;
}

方法二
仅仅solve处有不同

int stk[maxn],top;
int l[maxn],r[maxn],suma[maxn],sumb[maxn];
void solve()
{
    for(int i=1;i<=n;i++)
    {
        suma[i]=suma[i-1];
        sumb[i]=sumb[i-1];
        if(sa[i]<=n1)suma[i]++;
        if(sa[i]>n1+1)sumb[i]++;
    }

    top=0;
    for(int i=2;i<=n;i++)
    {
        while(top && height[i]<=height[stk[top]])r[stk[top--]]=i-1;
        stk[++top]=i;
    }
    while(top)r[stk[top--]]=n;

    top=0;
    for(int i=n;i>=2;i--)
    {
        while(top && height[i]<height[stk[top]])l[stk[top--]]=i;
        stk[++top]=i;
    }
    while(top)l[stk[top--]]=1;
    LL ans=0;
    for(int i=2;i<=n;i++)
    {
        ans+=1ll*(suma[i-1]-suma[l[i]-1])*(sumb[r[i]]-sumb[i-1])*height[i];
        ans+=1ll*(sumb[i-1]-sumb[l[i]-1])*(suma[r[i]]-suma[i-1])*height[i];
    }
    cout<<ans<<endl;
}
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值