题目描述
题解
将高度差分、离散之后,问题可以转化为:一个长度为n-1的序列,求有多少子串满足ABA的形式,并且满足|A|>0,|B|=m。
于是我们可以枚举A的长度j,然后将整个序列分块,每块的大小为j,每块的关键点为块首的点。枚举每一个关键点i,取左右端点l=i,r=i+j+m,求出子串[l,n]和[r,n]的lcp,以及子串[1,l]和[1,r]的lcs,即从lr这两个点最多能向左和向右扩展多少个点使得扩展出的两个字符串完全相同。假设对于l,向左最大能扩展到x点,向右最大能扩展到y点,那么对于长度为2*j+m的子串,左端点在[x,y]内滑动时的每一个子串都是满足条件的。即如果求出的lcp+lcs>=j,ans+=(lcp+lcs-j+1)。
需要注意的是,对于每一个点i,向左和向右都最多扩展j-1个点,因为不能扩展到上一个或下一个关键点,避免重复计算。还有当lcp和lcs都不为0时,点i会被计算2次,应该在答案中减去。
上面的过程时间复杂度计算为
O(n+n2+n3+……+n(n−m)/2)=O(nlogn)
,求lcp和lcs的过程可以把字符串正反求两遍sa,用st表实现
O(1)
查询,那么总时间复杂度就是
O(nlogn)
。
代码
#include<algorithm>
#include<iostream>
#include<cstring>
#include<cstdio>
#include<cmath>
using namespace std;
#define N 50005
#define sz 16
#define inf 1000000000
int n,M,m,h[N],cha[N],p[N],X[N],lsh,ans;
int sa_1[N],rank_1[N],height_1[N],sa_2[N],rank_2[N],height_2[N];
int s[N],c[N],Xx[N],Yy[N],*x,*y;
int st_1[N][sz+5],st_2[N][sz+5];
inline int cmpp(int a,int b)
{
return X[a]<X[b];
}
inline void clear()
{
memset(s,0,sizeof(s)); memset(c,0,sizeof(c)); memset(Xx,0,sizeof(Xx)); memset(Yy,0,sizeof(Yy));
}
inline void build_sa(int *sa)
{
m=n;
x=Xx,y=Yy;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) c[x[i]=s[i]]++;
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (int i=n-k;i<n;++i) y[p++]=i;
for (int i=0;i<n;++i) if (sa[i]>=k) y[p++]=sa[i]-k;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) c[x[y[i]]]++;
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1; x[sa[0]]=0;
for (int i=1;i<n;++i) x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&
((sa[i-1]+k>=n?-1:y[sa[i-1]+k])==(sa[i]+k>=n?-1:y[sa[i]+k]))?p-1:p++;
if (p>n) break;
m=p;
}
}
inline void build_lcp(int *rank,int *height,int *sa)
{
for (int i=0;i<n;++i) rank[sa[i]]=i;
height[0]=0;
int k=0;
for (int i=0;i<n;++i)
{
if (!rank[i]) continue;
if (k) --k;
int j=sa[rank[i]-1];
while (i+k<n&&j+k<n&&s[i+k]==s[j+k]) ++k;
height[rank[i]]=k;
}
}
int main()
{
scanf("%d%d",&n,&M);
for (int i=1;i<=n;++i) scanf("%d",&h[i]);
for (int i=2;i<=n;++i) cha[i-1]=h[i]-h[i-1],X[i-1]=cha[i-1];
n--;
for (int i=1;i<=n;++i) p[i]=i;
sort(p+1,p+n+1,cmpp); X[0]=-inf;
for (int i=1;i<=n;++i)
if (X[p[i]]!=X[p[i-1]]) cha[p[i]]=++lsh;
else cha[p[i]]=lsh;
clear();
for (int i=1;i<=n;++i) s[i-1]=cha[i];
build_sa(sa_1);
build_lcp(rank_1,height_1,sa_1);
clear();
for (int i=1;i<=n;++i) s[i-1]=cha[n-i+1];
build_sa(sa_2);
build_lcp(rank_2,height_2,sa_2);
for (int i=1;i<=n;++i) st_1[i][0]=height_1[i-1],st_2[i][0]=height_2[i-1];
for (int j=1;j<sz;++j)
for (int i=1;i<=n;++i)
if (i+(1<<j)-1<=n)
{
st_1[i][j]=min(st_1[i][j-1],st_1[i+(1<<(j-1))][j-1]);
st_2[i][j]=min(st_2[i][j-1],st_2[i+(1<<(j-1))][j-1]);
}
for (int j=1;j<=(n-M)/2;++j)
{
for (int i=1;i<=n&&i+j+M<=n;i+=j)
{
int l=i,r=i+j+M;
int ll=rank_1[l-1]+1,rr=rank_1[r-1]+1;
if (ll>rr) swap(ll,rr);
ll++;
int k=log2(rr-ll+1);
int pre=min(st_1[ll][k],st_1[rr-(1<<k)+1][k]);
pre=min(pre,j);
ll=rank_2[n-l]+1; rr=rank_2[n-r]+1;
if (ll>rr) swap(ll,rr);
ll++;
k=log2(rr-ll+1);
int nxt=min(st_2[ll][k],st_2[rr-(1<<k)+1][k]);
nxt=min(nxt,j);
int len;
if (pre&&nxt) len=pre+nxt-1;
else len=pre+nxt;
if (len>=j) ans+=(len-j+1);
}
}
printf("%d\n",ans);
}
总结
1、写sa注意边界,注意下标从0开始。
2、写rmq时注意height是i与i-1的lcp长度,不要min多了。