Substrings
问题描述:
给定若干区分大小写的字母字符串,找到最大的字符串X,使X或其反串可以作为任意给定字符串的子字符串找到。
输入:
输入的第一行包含一个整数t (1 <= t <= 10),测试用例的数量,然后是每个测试用例的输入数据。每个测试用例的第一行包含一个整数n (1 <= n <= 100),这是给定字符串的数量,后面跟着n行,每一行表示一个长度为最小1和最大100的字符串。字符串前后没有多余的空格。
输出:
每个测试用例应该有一行包含找到的最大字符串的长度。
分析:
多字符串处理一般都是连接起来(记得分隔)。
将字符串及其反串连接起来,串之间用各不相同的没出现过的字符(其实都不算字符了)分隔。
计算出sa和height数组。
二分长度并且判断数量是否等于串的数量就行了(其实也就是判断是否所有串都有)
code:
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
#define ll long long
using namespace std;
const int maxm=2e4+5;
int s[maxm];
int t1[maxm],t2[maxm],c[maxm];
int rk[maxm],sa[maxm],height[maxm];
int n,m;
bool cmp(int *r,int a,int b,int k){
return r[a]==r[b]&&r[a+k]==r[b+k];
}
void getsa(){
int *x=t1,*y=t2;
for(int i=0;i<m;i++)c[i]=0;
for(int i=0;i<n;i++)c[x[i]=s[i]]++;
for(int i=1;i<m;i++)c[i]+=c[i-1];
for(int i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1){
int num=0;
for(int i=n-k;i<n;i++)y[num++]=i;
for(int i=0;i<n;i++)if(sa[i]>=k)y[num++]=sa[i]-k;
for(int i=0;i<m;i++)c[i]=0;
for(int i=0;i<n;i++)c[x[i]]++;
for(int i=1;i<m;i++)c[i]+=c[i-1];
for(int i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
x[sa[0]]=0;
num=1;
for(int i=1;i<n;i++){
x[sa[i]]=cmp(y,sa[i],sa[i-1],k)?num-1:num++;
}
if(num>=n)break;
m=num;
}
}
void geth(){
int k=0;
for(int i=1;i<=n;i++)rk[sa[i]]=i;
for(int i=0;i<n;i++){
if(k)k--;
int j=sa[rk[i]-1];
while(i+k<n&&j+k<n&&s[i+k]==s[j+k])k++;
height[rk[i]]=k;
}
}
int k;
char temp[105];
int belong[maxm];
bool mark[105];
bool check(int x){
memset(mark,0,sizeof mark);
int cnt=0;
for(int i=2;i<=n;i++){
if(height[i]>=x){
if(!mark[belong[sa[i]]])mark[belong[sa[i]]]=1,cnt++;
if(!mark[belong[sa[i-1]]])mark[belong[sa[i-1]]]=1,cnt++;
if(cnt>=k)return 1;//等于k的时候也就是每个串都有
}else{
memset(mark,0,sizeof mark);
cnt=0;
}
}
return 0;
}
void solve(){
int ans=0;
int l=1,r=100;
while(l<=r){//二分长度
int mid=(l+r)/2;
if(check(mid)){
ans=mid;
l=mid+1;
}else{
r=mid-1;
}
}
printf("%d\n",ans);
}
int main(){
int T;
scanf("%d",&T);
while(T--){
scanf("%d",&k);
n=0;m=1000;
int zzz=1;
for(int i=1;i<=k;i++){
scanf("%s",temp);
int len=strlen(temp);
for(int j=0;j<len;j++){//正串
s[n++]=temp[j];
belong[n-1]=i;//记录属于那个串
}
s[n++]='Z'+zzz++;//分隔
belong[n-1]=i;
for(int j=len-1;j>=0;j--){//反串
s[n++]=temp[j];
belong[n-1]=i;
}
s[n++]='Z'+zzz++;
belong[n-1]=i;
}
s[n-1]=0;
getsa();
n--;
geth();
solve();
}
return 0;
}