poj3294Life Forms-后缀数组

题意:输入n个DNA序列,你的任务是求出一个长度最大的字符串,使得它在超过一半的DNA序列中连续出现。如果有多解,按照字典序从小到大输出所有解。 
【输入格式】 
输入包含多组数据。每组数据第一行为DNA串的个数n(1<=n<=100),以下n行每行为一个由不超过1000个小写字母组成的非空字符串。输入结束标志为n=0。 
【输出格式】 
对于每组数据,输出所有解,按照字典序从小到大排列。如果无解,输出一行”?”(不包含引号) 

解法:把字符串用不同的字符连接起来(所有的用于连接的字符都不同) 

然后跑下后缀数组,按照lcp不小于二分的mid分组,然后再判断这一组里面是不是有足够的分布在不同的字符串里。

#include<cstdio>
#include<cstring>
#define r 110000
int a[r],b[r],c[r],id[r],e[r],f[r],h[r],s[r];
int visit[201];
void getsa(int n,int m)
{
    int i,j,p,*x=e,*y=f,*t;
    for(i=0;i<m;i++) b[i]=0;
    for(i=0;i<n;i++) b[x[i]=s[i]]++;
    for(i=1;i<m;i++) b[i]+=b[i-1];
    for(i=n-1;i>=0;i--) a[--b[x[i]]]=i;
    for(p=1,j=1;p<n;j*=2,m=p)
    {
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(a[i]>=j) y[p++]=a[i]-j;
        for(i=0;i<n;i++) c[i]=x[y[i]];
        for(i=0;i<m;i++) b[i]=0;
        for(i=0;i<n;i++) b[c[i]]++;
        for(i=1;i<m;i++) b[i]+=b[i-1];
        for(i=n-1;i>=0;i--) a[--b[c[i]]]=y[i];
        for(i=1,p=1,t=x,x=y,y=t,x[a[0]]=0;i<n;i++)
            x[a[i]]=(y[a[i]]==y[a[i-1]]&&y[a[i]+j]==y[a[i-1]+j])?p-1:p++;
    }
}
void getheight(int n)
{
    int i,j,k=0;
    for(i=1;i<=n;i++) b[a[i]]=i;
    for(i=0;i<n;i++)
    {
        if(k) k--;
        j=a[b[i]-1];
        while(s[i+k]==s[j+k]) k++;
        h[b[i]]=k;
    }
}
int check(int k,int m,int n)
{
    int i,j,t=0;
     memset(visit,0,sizeof(visit));
    for(i=2;i<=n;i++)
    {
        if(h[i]<k)
        {
            t=0;
            memset(visit,0,sizeof(visit));
            continue;
        }
        if(!visit[id[a[i]]])
        {
            t++;
            visit[id[a[i]]]=1;
        }
        if(!visit[id[a[i-1]]])
        {
            t++;
            visit[id[a[i-1]]]=1;
        }
        if(t>m) return 1;
    }
return 0;
}
void put(int k,int m,int n)
{
    int i,j,x,t=0;
     memset(visit,0,sizeof(visit));
    for(i=2;i<=n;i++)
    {
        if(h[i]>=k)
        {
            if(!visit[id[a[i]]])
            {
                t++,x=a[i];
                visit[id[a[i]]]=1;
            }
            if(!visit[id[a[i-1]]])
            {
                t++;
                visit[id[a[i-1]]]=1;
            }
        }
        else
        {
            if(t>m)     //去重
            {
                for(j=0;j<k;j++)
                {
                    putchar(s[x+j]+'a'-1);
                }
                putchar('\n');
            }
            t=0;
            memset(visit,0,sizeof(visit));
        }
    }
}

int main()
{
    int n,m,i,j,k,t;
    char str[1005];
    while(~scanf("%d",&n),n)
    {
        t=0;m=r;
        for(i=0;i<n;i++)
        {
            scanf("%s",str);
            for(j=0;str[j]!='\0';j++)
            {
                s[t]=str[j]-'a'+1;
                id[t++]=i;
            }
            m=m<j?m:j;
            s[t]=27+i;
            id[t++]=27+i;
        }
        s[t]=0;
        getsa(t+1,30+n+1);
        getheight(t);
        i=0,j=m,k=0,n/=2;
        while(i<=j)
        {
            m=(i+j)/2;
            if(check(m,n,t))
            {
                k=m;
                i=m+1;
            }
            else j=m-1;
        }
        if(!k) puts("?");
        else put(k,n,t);
        putchar('\n');
    }
return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值