Corporate Identity——后缀数组

题意:多个字符串的最长公共子串

如果是一个字符串的最长可重叠的公共子串,那么直接利用求出max(height)即可
如果是一个字符串的最长不可重叠的公共子串,那么先二分答案,转化成判别式的问题比较好处理。假设当前需要判别长度为k是否符合要求,只需把排序后的后缀分成若干组,其中每组的后缀之间的Height 值都不小于k,再判断其中有没有不重复的后缀,具体就是看最大的SA值和最小的SA值相差超不超过k,有一组超过的话k就是合法答案。

在这一题中,我们可以考虑将这些区间拼在一起,二分答案k,找出一段连续区间使得height>=k,但因为这些子串必须隶属于不同的字符串,所以我们还需要判断这些子串的归属。

#include<iostream>
#include<algorithm>
#include<stdio.h>
#include<string.h>
using namespace std;
/*
	后缀数组模板,下标从0开始
	s[]原字符串 
	后缀sa[i]和sa[j] LCP(i, j) = min{height[k] | min{i, j} < k <= max{i, j}}为最长公共前缀 
	Heigth[i] : 范围[1,n-1]表示Suffix[SA[i]]和Suffix[SA[i - 1]]的最长公共前缀,
		也就是排名相邻的两个后缀的最长公共前缀	
		越早出现的height字典序越小 
		因此min(连续的height[i]->height[j])一定是这段区间最长的公共子串大小
	rank[i] 第i个后缀的排名; SA[i] 排名为i的后缀位置
*/ 

const int N=1000010;
int s[N];
int c[N],x[N],y[N],n,m,height[N],rk[N],sa[N];
void Suffix()
{
     for(int i=0;i<m;i++) c[i]=0;
     for(int i=0;i<n;i++) c[x[i]=s[i]]++;
     for(int i=1;i<m;i++) c[i]+=c[i-1];
     for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
     for(int k=1;k<=n;k<<=1)
     {
         int p=0;
         for(int i=n-k;i<n;i++) y[p++]=i;
         for(int i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
 
         for(int i=0;i<m;i++) c[i]=0;
         for(int i=0;i<n;i++) c[x[y[i]]]++;
         for(int i=1;i<m;i++) c[i]+=c[i-1];
         for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
         swap(x,y);
         p=1;x[sa[0]]=0;
         for(int i=1;i<n;i++)
            x[sa[i]]= y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
         if(p>=n) break;
         m=p;
     }
}
void getheight()
{
    for(int i=0;i<n;i++) rk[sa[i]]=i;
    for(int i=0,k=0;i<n;i++)
    {
        if(rk[i])
        {
            if(k) --k;
            //else k=0;
            int j=sa[rk[i]-1];
            while(s[i+k]==s[k+j]) k++;
            height[rk[i]]=k;
        }
    }
}

char str[4010];
int vis[N],id[N];int t,ans;

int check(int x)//找出连续n个height数组 
{
    for(int i=1;i<n;i++)
    {
        if(height[i]<x) continue;
        int cnt=0;
        for(int j=0;j<=t;j++) vis[j]=0;
        while(height[i]>=x&&i<n)
        {
            if(!vis[id[sa[i-1]]])
            {
                vis[id[sa[i-1]]]=1;
                cnt++;
            }
            i++;
        }
        if(!vis[id[sa[i-1]]])
        {
                vis[id[sa[i-1]]]=1;
                cnt++;
        }
        if(cnt>=t)
        {
            ans=sa[i-1];
            return 1;
        }
    }
    return 0;
}
int main()
{
    while(~scanf("%d",&t)&&t)
    {
        n=0;int cnt=30;
        for(int i=0;i<t;i++)
        {
            scanf("%s",str);
            int l1=strlen(str);
            for(int j=0;j<l1;j++)
            {
                s[n++]=str[j]-'a'+1;
                id[n-1]=i;
            }
            s[n++]=cnt++;
 
        }
        s[n++]=0;
        m=cnt;
        Suffix();
        getheight();
        int l=1,r=200,mid,len=0;
        while(l<=r)
        {
            mid=(l+r)>>1;
            if(check(mid))
            {
                len=mid;
                l=mid+1;
            }
            else
                r=mid-1;
        }
        if(len==0) printf("IDENTITY LOST\n");
        else
        {
            for(int i=ans;i<ans+len;i++)
                printf("%c",s[i]+'a'-1);
            printf("\n");
        }
    }
    return 0;
}
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值