POJ3450
链接
题意为求多个串的最长公共子串,参考上题的做法,我们可以用特殊字符对所有字符串进行拼接,但是问题在于如果找到这个最长公共子串。数据量为
n<4000len<200
n
<
4000
l
e
n
<
200
如果我们像上题一样遍历所有的长度是不可能的,所以我们可以二分这个长度然后进行验证。
那么怎么验证呢?
我们可以从 2−n 2 − n 遍历height数组,如果有某一段连续的区间 height h e i g h t 数组均大于 mid m i d ,而且这段区间拥有来自 n n 个串的后缀,就说明是可行的。如果方案可行,我们可以保存这个最长子串的起始位置,也就是 sa[i] s a [ i ] ,以便最后输出字符串。
本体要提前预处理新串的每个位置来自那个字符串,以便验证。验证的复杂度为 O(len+n∗k) O ( l e n + n ∗ k ) len l e n 为新串长度,n为原串个数,k为拥有大于mid的height数组的块数,其中 n∗k n ∗ k 是每次重置vis数组以便统计某个块来自多少个不同的子串。
POJ3450代码
#include <iostream>
#include<algorithm>
#include <stdio.h>
#include <string.h>
using namespace std;
#define maxn 800005
const int INF = 0x3f3f3f3f;
int wa[maxn],wb[maxn],wsf[maxn],wv[maxn],sa[maxn];
int rank[maxn],height[maxn],s[maxn];
char str[4005][205];
int t,lenn[maxn];
int belong[maxn];
int anspos;
int vis[4005];
int cmp(int *r,int a,int b,int k)
{
return r[a]==r[b]&&r[a+k]==r[b+k];
}
void getsa(int *r,int *sa,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0; i<m; i++) wsf[i]=0;
for(i=0; i<=n; i++) wsf[x[i]=r[i]]++;
for(i=1; i<m; i++) wsf[i]+=wsf[i-1];
for(i=n; i>=0; i--) sa[--wsf[x[i]]]=i;
p=1;
j=1;
for(; p<=n; j*=2,m=p)
{
for(p=0,i=n+1-j; i<=n; i++) y[p++]=i;
for(i=0; i<=n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0; i<=n; i++) wv[i]=x[y[i]];
for(i=0; i<m; i++) wsf[i]=0;
for(i=0; i<=n; i++) wsf[wv[i]]++;
for(i=1; i<m; i++) wsf[i]+=wsf[i-1];
for(i=n; i>=0; i--) sa[--wsf[wv[i]]]=y[i];
t=x;
x=y;
y=t;
x[sa[0]]=0;
for(p=1,i=1; i<=n; i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)? p-1:p++;
}
}
void getheight(int *r,int n)
{
int i,j,k=0;
for(i=1; i<=n; i++) rank[sa[i]]=i;
for(i=0; i<n; i++)
{
if(k)
k--;
else
k=0;
j=sa[rank[i]-1];
while(r[i+k]==r[j+k])
k++;
height[rank[i]]=k;
}
}
int check(int x,int n)
{
for(int i=1;i<=n-1;i++)
{
if(height[i]<x) continue;
int cnt=0;
for(int j=0;j<=t;j++) vis[j]=0;
while(height[i]>=x&&i<=n-1)
{
if(!vis[belong[sa[i-1]]])
{
vis[belong[sa[i-1]]]=1;
cnt++;
}
i++;
}
if(!vis[belong[sa[i-1]]])
{
vis[belong[sa[i-1]]]=1;
cnt++;
}
if(cnt>=t)
{
anspos=sa[i-1];
return true;
}
}
return false;
}
int main()
{
int len,n;
while(~scanf("%d",&t))
{
if(t==0) break;
n=0;
int pos=30;
for(int i=0;i<t;i++)
{
scanf("%s",str[i]);
lenn[i]=strlen(str[i]);
for(int j=0;j<lenn[i];j++)
{
s[n++]=str[i][j]-'a'+1;
belong[n-1]=i;
}
s[n++]=pos++;
}
s[n]=0;
getsa(s,sa,n,5000);
getheight(s,n);
int l=1,r=200,mid;
while(l<=r)
{
mid=(l+r)>>1;
if(check(mid,n)) l=mid+1;
else r=mid-1;
}
if(r==0) printf("IDENTITY LOST\n");
else
{
for(int i=anspos;i<anspos+r;i++)
printf("%c",s[i]-1+'a');
printf("\n");
}
}
return 0;
}