题目描述
题解
orz hxy sam随便艹
不过我感觉这道题用sa的做法非常厉害吖
由于每一个子串一定是某一个后缀的前缀,所以可以对于每一个后缀求其对答案能贡献多少个子串,也就是这个后缀有多少个满足题意的前缀。同时可以发现,对于同一个后缀
Si
,如果
Si,j
满足题意那么
Si,i...Si,j
都满足题意,也就是说这个贡献的值也是满足单调性的,所以对于每一个后缀,我们可以二分它的贡献。
二分出贡献mid的之后,如何进行判定呢?关键就是height数组。由于两个后缀的最长公共前缀是它们在height数组中的区间最小值,我们发现,两个后缀离得越远,这个最小值一定是单调不升的。也就是说,一旦确定了一个后缀,这个后缀向两边扩展最长公共前缀得长度也满足单调性。那么我们对于一个后缀,二分出了贡献mid之后,还可以继续二分贡献>=mid的后缀最左边和最右边在哪里。
如果这个贡献满足题意的话,二分出最左边和最右边,那么就说明从最左边到最右边这一段所有的后缀是不小于k个字符串中的。其实我们不需要求出这一段具体有多少个字符串,只需要判断是否不小于k就行了。那么可以在height数组上预处理出对于每一个l,最近的包含了不小于k的字符串的r在哪里,这样的话就可以
O(1)
判断了。
用st表可以实现对区间最小值的
O(1)
查询,所以整个算法的时间复杂度为
O(nlog2n)
。
需要注意的问题:
①height数组表示的是当前的和前一个,所以求最小值的时候左端点应该+1
②要保证所有的height值不能超过这个后缀所表示的字符串本身的长度
代码
#include<iostream>
#include<cstring>
#include<cstdio>
using namespace std;
#define LL long long
#define N 200005
#define sz 17
char a[N],s[N];
int T,k,la,n,m;
int str[N],is_end[N],*x,*y,X[N],Y[N],c[N],sa[N],height[N],Rank[N];
int st[N][sz+5],lg[N],l,r,flag[N],cnt,f[N],est[N];
LL ans[N];
void build_sa()
{
m=200;
x=X,y=Y;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) ++c[x[i]=s[i]];
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (int i=n-k;i<n;++i) y[p++]=i;
for (int i=0;i<n;++i) if (sa[i]>=k) y[p++]=sa[i]-k;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) ++c[x[y[i]]];
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1,x[sa[0]]=0;
for (int i=1;i<n;++i)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&((sa[i-1]+k<n?y[sa[i-1]+k]:-1)==(sa[i]+k<n?y[sa[i]+k]:-1))?p-1:p++;
if (p>n) break;
m=p;
}
}
void build_height()
{
for (int i=0;i<n;++i) Rank[sa[i]]=i;
int k=0;height[0]=0;
for (int i=0;i<n;++i)
{
if (!Rank[i]) continue;
if (k) --k;
int j=sa[Rank[i]-1];
while (i+k<n&&j+k<n&&s[i+k]==s[j+k]) ++k;
height[Rank[i]]=k;
}
}
void rmq()
{
for (int i=1,p=0;i<=n;++i)
{
while ((1<<p)<=i) ++p;
lg[i]=p-1;
}
for (int i=1;i<=n;++i) st[i][0]=height[i-1];
for (int j=1;j<sz;++j)
for (int i=1;i<=n;++i)
if (i+(1<<j)-1<=n)
st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
int query(int l,int r)
{
if (l>r) return 0;
++l,++r;
int k=lg[r-l+1];
return min(st[l][k],st[r-(1<<k)+1][k]);
}
int findl(int x,int len,int l,int r)
{
int mid,ans=-1;
while (l<=r)
{
mid=(l+r)>>1;
int t=query(mid+1,x);
if (mid==x) t=len;
if (t>=len) ans=mid,r=mid-1;
else l=mid+1;
}
return ans;
}
int findr(int x,int len,int l,int r)
{
int mid,ans=-1;
while (l<=r)
{
mid=(l+r)>>1;
int t=query(x+1,mid);
if (mid==x) t=len;
if (t>=len) ans=mid,l=mid+1;
else r=mid-1;
}
return ans;
}
bool check(int x,int len)
{
int l1=findl(x,len,0,x);
if (l1==-1) l1=x;
int l2=findr(x,len,x,n-1);
if (l2==-1) l2=x;
if (est[l1]<=l2) return true;
else return false;
}
int find(int id)
{
int l=0,r=is_end[str[sa[id]]]-sa[id],mid,ans=0;
while (l<=r)
{
mid=(l+r)>>1;
if (check(id,mid)) ans=mid,l=mid+1;
else r=mid-1;
}
return ans;
}
int main()
{
scanf("%d%d",&T,&k);
for (int i=1;i<=T;++i)
{
scanf("%s",a);la=strlen(a);
for (int j=0;j<la;++j)
s[n++]=a[j],str[n-1]=i;
if (i!=T) s[n++]='$',str[n-1]=i;
is_end[i]=n-1;
}
is_end[T]=n;
build_sa();
build_height();
for (int i=0;i<n;++i)
height[i]=min(height[i],is_end[str[sa[i]]]-sa[i]);
rmq();
l=T-2;r=T-2;
while (l<n-1)
{
if (l!=T-2)
{
--flag[str[sa[l]]];
if (!flag[str[sa[l]]]) --cnt;
}
++l;
while (r<n-1&&cnt<k)
{
++r;
if (!flag[str[sa[r]]]) ++cnt;
++flag[str[sa[r]]];
}
if (cnt<k) est[l]=n;
else est[l]=r;
}
for (int i=0;i<n;++i)
{
if (s[i]=='$') continue;
f[i]=find(Rank[i]);
}
for (int i=0;i<n;++i)
ans[str[i]]+=(LL)f[i];
for (int i=1;i<=T;++i)
{
printf("%lld",ans[i]);
if (i!=T) putchar(' ');
}
}