题意:给定 m 个长度为 60 的 DNA 字符串,求所有字符串的最长公共子串,若有多个则输出字典序最小的。公共子串长度小于三无效。
分析:可以用暴力枚举第一个字符串的所有子串然后用 strstr(),不过做这题是为了练 KMP,就用 KMP 解了。
代码:
#include<cstdio>
#include<cstring>
#include<iostream>
using namespace std;
const int N = 66;
int nxt[N];
char a[11][N];
char b[N],ans[N];
int n=60,m,cnt;
void GetNext()
{
nxt[0]=-1;
int j=0,k=-1;
while(j<cnt)
{
if(k==-1||b[j]==b[k])
{
++j;++k;
nxt[j]=k;
}
else
{
k=nxt[k];
}
}
}
bool kmp(int h)
{
int i=0,j=0;
while(i<n)
{
if(j==-1||a[h][i]==b[j])
{
i++;j++;
}
else
{
j=nxt[j];
}
if(j==cnt)
return true;
}
return false;
}
bool cmp(char a[],char b[],int len)
{
for(int i=0;i<len;i++)
{
if(a[i]<b[i]) return true;
if(a[i]>b[i]) return false;
}
return true;
}
int main()
{
freopen("1.txt","r",stdin);
int T;
scanf("%d",&T);
while(T--)
{
ans[0]='Z'+1; ans[1]='\0';
int ok=0;
scanf("%d",&m);
for(int i=0;i<m;i++)
cin>>a[i];
for(int i=n;i>=3;i--)
{
cnt=i;
for(int k=0;k<n-i+1;k++)
{
for(int j=k;j<k+i;j++)
{
b[j-k]=a[0][j];
}
b[i+k]='\0';
if(cmp(ans,b,cnt)) continue; //相同长度字典序偏小,则没必要再判断了
GetNext();
int tot=0;
for(int h=1;h<m;h++)
{
if(kmp(h)) tot++;
else break;
}
if(tot==m-1)
{
for(int i=0;i<cnt;i++) ans[i]=b[i]; ans[cnt]='\0';
ok=1;
}
}
if(ok)
{
break;
}
}
if(ok)
cout<<ans<<endl;
else
puts("no significant commonalities");
}
return 0;
}