题目大意:
给出一个A串和很多个B串,求出A中有多少个子串,是所有的B中没有出现的。
思路分析:
后缀数组的作用很容易的求出来整个串中不同的子串个数。
现在要求的是A中不同的,且在B中没有出现过的。
先把AB 串全部连接,跑一遍suffix array。然后求出有多少个不同的子串。
然后再单独用B 串跑 suffix array。再求出单独在B 中有多少个不同的 子串。
然后结果就是 ans1 - ans2 ...
需要注意的问题就是,连接的时候需要把每一个串后面加一个特殊符。但是求不同串的时候是不能算进去的。
所以要进行一些判断。
#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
#include <vector>
#define lson num<<1,s,mid
#define rson num<<1|1,mid+1,e
#define maxn 311005
#define inf 0x3f3f3f3f
using namespace std;
typedef long long ll;
int str[maxn<<1];
int sa[maxn],t1[maxn],t2[maxn],c[maxn];
void suffix(int n,int m)
{
int *x=t1,*y=t2;
for(int i=0; i<m; i++)c[i]=0;
for(int i=0; i<n; i++)c[x[i]=str[i]]++;
for(int i=1; i<m; i++)c[i]+=c[i-1];
for(int i=n-1; i>=0; i--)sa[--c[x[i]]]=i;
for(int k=1; k<=n; k<<=1)
{
int p=0;
for(int i=n-k; i<n; i++)y[p++]=i;
for(int i=0; i<n; i++)if(sa[i]>=k)y[p++]=sa[i]-k;
for(int i=0; i<m; i++)c[i]=0;
for(int i=0; i<n; i++)c[x[y[i]]]++;
for(int i=0; i<m; i++)c[i]+=c[i-1];
for(int i=n-1; i>=0; i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;
x[sa[0]]=0;
for(int i=1; i<n; i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
if(p>=n)break;
m=p;
}
}
int rank[maxn],height[maxn];
void getheight(int n)
{
int k=0;
for(int i=0; i<n; i++)rank[sa[i]]=i;
for(int i=0; i<n; i++)
{
if(k)k--;
if(!rank[i])continue;
int j=sa[rank[i]-1];
while(str[i+k]==str[j+k])k++;
height[rank[i]]=k;
}
}
char tmp[maxn];
int dex[maxn];
int len[maxn];
int main()
{
int T,CASE=1;
scanf("%d",&T);
int tp;
while(T--)
{
memset(dex,0x3f,sizeof dex);
memset(len,0,sizeof len);
tp=0;
int N;
scanf("%d",&N);
scanf("%s",tmp);
len[1] = strlen(tmp);
for(int j=0;j<len[1];j++)
{
dex[tp]=1;
str[tp++]=tmp[j];
}
str[tp++]=1+128;
for(int i=2;i<=N+1;i++)
{
scanf("%s",tmp);
len[i]=strlen(tmp);
for(int j=0;j<len[i];j++)
{
dex[tp]=i;
str[tp++]=tmp[j];
}
str[tp++]=i+128;
len[i]=tp-1;
}
str[tp-1]=0;
suffix(tp,N+200);
getheight(tp);//对AB串进行处理
ll ans=0;
for(int i=1;i<tp;i++)
{
if(dex[sa[i]]!=inf)
ans+=len[dex[sa[i]]]-sa[i]-height[i];
}
for(int i=len[1]+1;i<tp;i++)
{
str[i-len[1]-1]=str[i];
dex[i-len[1]-1]=dex[i];
}
for(int i=2;i<=N+1;i++)
len[i]-=len[1]+1;
tp-=len[1]+1;
suffix(tp,N+200);
getheight(tp);//对B串单独进行处理
ll tans = 0;
for(int i=1;i<tp;i++)
{
if(dex[sa[i]]!=inf)
tans+=len[dex[sa[i]]]-sa[i]-height[i];
}
printf("Case %d: %I64d\n",CASE++,ans-tans);
}
return 0;
}