地理项目是IBM和国家地理学会的合作研究项目,从成千上万捐献的DNA分析地球上人类是如何繁衍的。
作为一个IBM的研究人员,请你写一个程序找出给定的DNA片段之间的相同之处,使得对个体的调查相关联。
一个DNA碱基序列是指把在分子中发现的氮基的序列给罗列出来。有四种氮基:腺嘌呤 (A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(D),例如,一个6碱基DNA序列可以表示为 TAGACC。
给出一个DNA碱基序列的集合,确定在所有序列中都出现的最长的碱基序列。
输入格式:
输入的第一行给出了整数n,表示测试数据集合的数目。每个测试数据集合由下述两部分组成:
一个正整数m(2≤m≤10),给出数据集合中碱基序列的数目。
m行,每行给出一个60碱基的碱基序列。
输出格式:
对于输入的每个测试数据集合的所有的碱基序列,输出最长的相同的碱基子序列。
如果最长的相同的碱基子序列的长度小于3,则输出“no significant commonalities”来代替碱基子序列。
如果相同最长长度的子序列有多个,则仅输出按字母排序的第一个。
输入样例:
3
2
GATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
3
GATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATA
GATACTAGATACTAGATACTAGATACTAAAGGAAAGGGAAAAGGGGAAAAAGGGGGAAAA
GATACCAGATACCAGATACCAGATACCAAAGGAAAGGGAAAAGGGGAAAAAGGGGGAAAA
3
CATCATCATCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
ACATCATCATAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AACATCATCATTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT
输出样例:
no significant commonalities
AGATAC
CATCATCAT
标签:
字符串,BF算法,KMP算法
来源:
ACM South Central USA 2006
code:
#include<stdio.h>
#include<string.h>
#define maxsize 80
void match(char c[][maxsize],int m) ///二维数组c的行数为n