大致题意:
给出一个DNA序列集合,求在所有序列中都出现的最长的碱基序列。(碱基序列e.g.:TAGACC)
若有多个,输出字典序最小的一个。
这里用朴素算法做的…
可用KMP
多多练手 。。
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int M = 15, S = 65;
int main(){
int t;
scanf("%d", &t);
while(t--){
int m;
char p[M][S];
scanf("%d", &m);
for(int i = 0; i < m; i++)
scanf("%s", p[i]);//存下所有串
int len;
char ans[S];//最长公共子串
len = 0;
for(int i = 0; i < strlen(p[0]); i++){//枚举子串判断是否目标子串
for(int j = i + 2; j < strlen(p[0]); j++){
char s[S];//提取该子串s
strncpy(s, p[0] + i, j - i + 1);
s[j - i + 1] = '\0';
bool ok = true;
for(int k = 1; ok && k < m; k++)
if(strstr(p[k], s) == NULL)//strstr() - locate substring
ok = false;
if(ok && (j - i + 1 > len || j - i + 1 == len && strcmp(ans, s) > 0)){
len = j - i + 1;
strcpy(ans, s);
}
}
}
if(len < 3)
puts("no significant commonalities");
else
printf("%s\n", ans);
}
return 0;
}