BZOJ 3238 差异

lcc_cat

于 2019-01-06 16:00:22 发布

阅读量191

点赞数 1

分类专栏：字符串

本文链接：https://blog.csdn.net/qq_35541672/article/details/85930192

版权

字符串专栏收录该内容

8 篇文章 0 订阅

订阅专栏

题意

给出一个长度为n的字符串S，令 $T_i$ 表示它从第i个字符开始的后缀。求
（其中 $l e n (a)$ 表示字符串a的长度，lcp(a,b)表示字符串a和字符串b的最长公共前缀）
$ans=\sum_{1\leq i<j \leq n}len(T_i)+len(T_j)-2*lcp(T_i,T_j)$

题解

我们试图转化要求和的那一坨，然而似乎并不能转化出什么？
我们可以分成两部分
$ans_1=\sum_{1\leq i<j \leq n}len(T_i)+len(T_j)=\sum_{1\leq i<j \leq n}(n-i+1)+(n-j+1)=\sum_{1\leq i<j \leq n}i+j\\ =\sum_{i=1}^n((n-i)i+\sum_{j=i+1}^nj)=\sum_{i=1}^n((n-i)i+\frac{n^2+n-i^2-i}{2})\\ =\sum_{i=1}^n(n-i)i+\frac{n(n+1)}{2}-\frac{i^2+i}{2}\\ =\frac{n^2(n+1)}{2}+\sum_{i=1}^nn_i+\frac{-3i^2-i}{2}\\ =\frac{n^2(n+1)}{2}+n\sum_{i=1}^ni-\frac{3}{2}\sum_{i=1}^ni^2-\frac{1}{2}\sum_{i=1}^ni\\ =n^2(n+1)-\frac{n(n+1)(2n+1)}{4}-\frac{n(n+1)}{4}=n^2(n+1)-\frac{n(n+1)^2}{2}\\ =\frac{n(n-1)(n+1)}{2}$
em…推得好像有点复杂
所以…还可以这样想，每个数会被算n-1次，所以就是 $\sum_{i=1}^n(n-1)i=\frac{n(n-1)(n+1)}{2}$
$ans=ans_1-2*ans_2$
下面的问题就是解决 $ans_2$

后缀自动机解法

求后缀的lcp，就相当于求翻转串的前缀的最长公共后缀
对于自动机上两个真节点（相对于复制节点而言）u,v，他们的lca能表示出的最长长度就是这两个前缀的最长公共后缀
所以我们就可以进行一次dfs，统计出Right大小，同时计算出以当前点为lca时的贡献

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1000000+5,T=1000000+5;
const int INF=1<<30;
typedef long long ll;
char s[N];
int sz[N];
struct node{
    node *fail;
    node *ch[26];
    int len;
}a[T],*last,*tcnt,*root;
void Init(){
    last=tcnt=root=&a[0];
}
void Insert(char *s){
    int n=strlen(s);
    last=root;
    for(int i=0;i<n;i++){
        int c=s[i]-'a';
        node *p=last,*np=++tcnt,*q,*nq;
        last=np;
        np->len=p->len+1;
        sz[np-root]=1;
        while(p&&!p->ch[c])
            p->ch[c]=np,p=p->fail;
        if(!p)
            np->fail=root;
        else{
            q=p->ch[c];
            if(q->len==p->len+1){
                np->fail=q;
            }
            else{
                nq=++tcnt;
                *nq=*q;
                nq->len=p->len+1;
                np->fail=nq;
                q->fail=nq;
                while(p&&p->ch[c]==q)
                    p->ch[c]=nq,p=p->fail;
            }
        }
    }
}
struct mode{
    int u,v,w,nxt;
}edge[N*2];
int head[N],mcnt;
void add_edge(int u,int v,int w){
    mcnt++;
    edge[mcnt].u=u;
    edge[mcnt].v=v;
    edge[mcnt].w=w;
    edge[mcnt].nxt=head[u];
    head[u]=mcnt;
    //printf("%d ->%d :%d\n",u,v,w);
}
int dist[N];
ll val[N];
void dfs(int u){
    for(int i=head[u];i;i=edge[i].nxt){
        int v=edge[i].v,w=edge[i].w;
        dist[v]=dist[u]+w;
        dfs(v);
        val[u]+=1ll*sz[u]*sz[v];
        sz[u]+=sz[v];
    }
}
int main()
{
    Init();
    scanf("%s",s);
    int n=strlen(s);
    reverse(s,s+n);
    Insert(s);
    for(node *p=root+1;p<=tcnt;p++){
        add_edge(p->fail-root,p-root,p->len-p->fail->len);
    }
    dfs(0);
    ll ans2=0;
    for(int i=0;root+i<=tcnt;i++)
        ans2+=1ll*dist[i]*val[i];
    ans2*=2;
    ll ans1=1ll*n*(n+1)/2*(n-1);
    printf("%lld\n",ans1-ans2);
}

后缀数组解法

我们知道LCP(i,j)就是对应height间的最小值
那么我们可以想起这个问题：
给出一个柱形图，答案加上每两个柱之间最小的高度
那么就显然可以用单调栈来做了
注意到相等的问题，我们左右两遍单调栈的取等不太一样即可

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
typedef long long ll;
const int N=1e6+5,C=128;
char a[N];
char s[N];
int b[N];
int n;
int arr[4][N];
int height[N];
int *sa,*rk,*nsa,*nrk;
void calc_sa(char *a){
    sa=arr[0],rk=arr[1],nsa=arr[2],nrk=arr[3];
    memset(b,0,sizeof b);
    for(int i=1;i<=n;i++)
        b[a[i]]++;
    for(int i=1;i<=C;i++)
        b[i]+=b[i-1];
    for(int i=1;i<=n;i++)
        sa[b[a[i]]--]=i;
    for(int i=1;i<=n;i++){
        rk[sa[i]]=rk[sa[i-1]];
        if(a[sa[i]]!=a[sa[i-1]])
            rk[sa[i]]++;
    }
    for(int k=1;rk[sa[n]]<n&&k<n;k<<=1){
        for(int i=1;i<=n;i++)
            b[rk[sa[i]]]=i;
        for(int i=n;i>=1;i--)
            if(sa[i]>k)
                nsa[b[rk[sa[i]-k]]--]=sa[i]-k;
        for(int i=n-k+1;i<=n;i++)
            nsa[b[rk[i]]--]=i;
        for(int i=1;i<=n;i++){
            nrk[nsa[i]]=nrk[nsa[i-1]];
            if(rk[nsa[i]]!=rk[nsa[i-1]]||rk[nsa[i]+k]!=rk[nsa[i-1]+k])
                nrk[nsa[i]]++;
        }
        swap(sa,nsa);
        swap(rk,nrk);
    }
}
void calc_height(char *a){
    for(int i=1,k=0;i<=n;i++){
        if(rk[i]==1)
            height[1]=0;
        else{
            if(k>0)
                k--;
            for(int j=sa[rk[i]-1];i+k<=n&&j+k<=n&&a[i+k]==a[j+k];k++) ;
            height[rk[i]]=k;
        }
    }
}
int st[N],top;
int L[N],R[N];
int main()
{
    scanf("%s",s+1);
    n=strlen(s+1);
    calc_sa(s);
    calc_height(s);
    for(int i=1;i<=n;i++){
        while(top&&height[st[top]]>=height[i])
            top--;
        L[i]=st[top];
        st[++top]=i;
    }
    top=0;
    st[0]=n+1;
    for(int i=n;i>=1;i--){
        while(top&&height[st[top]]>height[i])
            top--;
        R[i]=st[top];
        st[++top]=i;
    }
    ll ans=1ll*n*(n+1)/2*(n-1);
    for(int i=1;i<=n;i++)
        ans-=2ll*height[i]*(i-L[i])*(R[i]-i);
    printf("%lld\n",ans);
}

lcc_cat

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
BZOJ 3238 差异

题意给出一个长度为n的字符串S，令TiT_iTi表示它从第i个字符开始的后缀。求（其中len(a)len(a)len(a)表示字符串a的长度，lcp(a,b)表示字符串a和字符串b的最长公共前缀）ans=∑1≤i&amp;amp;amp;amp;lt;j≤nlen(Ti)+len(Tj)−2∗lcp(Ti,Tj)ans=\sum_{1\leq i&amp;amp;amp;amp;lt;j \leq n}len(T_i)+len(T_j)...
复制链接

扫一扫