转载请注明出处,谢谢http://blog.csdn.net/acm_cxlove/article/details/7854526 by---cxlove
题目:给出一个A串,给出若干个B串,问A串中有多少个不同的子串不是B中的子串
http://acm.hdu.edu.cn/showproblem.php?pid=4416
比赛中挺可惜的一题。
当时看了一下数据范围,A串为10W,看了一下Clarification,有10W的B串,但是题目说的是B串的长度总和不超过10W,我以为是每一个B串不超过10W。当时就吓尿了,果断放弃了
其实这种子串问题,比较明显是后缀数组,但是当时的数据让我没办法把所有的串拼接在一起。哎~~~~
将所有的串拼接在一起,中间用一个不同的字符分隔开。然后求一次后缀数组以及height数组。
然后对于A中的某一个后缀,统计一下有B中的LCA有多少,就OK了,说明有A的这个后缀有LCA个子串在B中出现过。
只需要从前往后以及从后往前统计一次height就OK了。注意我们这里统计的是A与B的LCA。如果连续的两个sa是A中,那我们需要求一次最小值,保证求的是和B串的LCA。
但是题目要求的是A中的不同的子串,所以还要去重,遍历一次,如果连续两个都是A串的,则更新一下
#include<iostream>
#include<cstdio>
#include<map>
#include<cstring>
#include<cmath>
#include<vector>
#include<algorithm>
#include<set>
#include<string>
#include<queue>
#define inf 1<<28
#define M 6000005
#define N 1000005
#define maxn 300005
#define Min(a,b) ((a)<(b)?(a):(b))
#define Max(a,b) ((a)>(b)?(a):(b))
#define pb(a) push_back(a)
#define mem(a,b) memset(a,b,sizeof(a))
#define LL long long
#define MOD 1000000007
using namespace std;
//以下为倍增算法求后缀数组
int wa[maxn],wb[maxn],wv[maxn],Ws[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(const int *r,int *sa,int n,int m){
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) Ws[i]=0;
for(i=0;i<n;i++) Ws[x[i]=r[i]]++;
for(i=1;i<m;i++) Ws[i]+=Ws[i-1];
for(i=n-1;i>=0;i--) sa[--Ws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p){
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) Ws[i]=0;
for(i=0;i<n;i++) Ws[wv[i]]++;
for(i=1;i<m;i++) Ws[i]+=Ws[i-1];
for(i=n-1;i>=0;i--) sa[--Ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return;
}
int sa[maxn],Rank[maxn],height[maxn];
//求height数组
void calheight(const int *r,int *sa,int n){
int i,j,k=0;
for(i=1;i<=n;i++) Rank[sa[i]]=i;
for(i=0;i<n;height[Rank[i++]]=k)
for(k?k--:0,j=sa[Rank[i]-1];r[i+k]==r[j+k];k++);
return;
}
int a[maxn],pos[maxn];
char str[maxn];
int main(){
int t,cas=0,n;
scanf("%d",&t);
while(t--){
int len,m=0,num=30;//A串的长度,所有串叠加在一起的长度,分隔字符
scanf("%d",&n);
scanf("%s",str);
len=strlen(str);
for(int i=0;i<len;i++) a[m++]=str[i]-'a'+1;
for(int i=0;i<n;i++){
a[m++]=num++;
scanf("%s",str);
int l=strlen(str);
for(int j=0;j<l;j++)
a[m++]=str[j]-'a'+1;
}
a[m]=0;
da(a,sa,m+1,num+1);
calheight(a,sa,m);
mem(pos,0);
//从前往后推
int tmp=inf;
for(int i=1;i<=m;i++){
if(sa[i]<len){
if(height[i]<tmp) tmp=height[i];
if(pos[sa[i]]<tmp) pos[sa[i]]=tmp;
}
else tmp=inf;
}
//从后往前推
tmp=inf;
for(int i=m;i>=1;i--){
if(sa[i-1]<len){
if(height[i]<tmp) tmp=height[i];
if(pos[sa[i-1]]<tmp) pos[sa[i-1]]=tmp;
}
else tmp=inf;
}
//排除A串自身相同的子串
for(int i=1;i<=m;i++)
if(sa[i]<len&& sa[i-1]<len)
if(pos[sa[i-1]]<height[i])
pos[sa[i-1]]=height[i];
LL ans=(LL)len*(len+1)/2;
for(int i=0;i<len;i++)
ans-=pos[i];
printf("Case %d: %I64d\n",++cas,ans);
}
return 0;
}