7-57-kmp模式匹配碱基序列匹配 (25分)

最新推荐文章于 2024-07-15 11:31:52 发布

-CZN-

最新推荐文章于 2024-07-15 11:31:52 发布

阅读量1.3k

点赞数 3

本文链接：https://blog.csdn.net/r5t5an/article/details/104136203

版权

该博客探讨了如何使用KMP模式匹配算法来寻找DNA碱基序列集合中的最长公共子序列。在IBM与国家地理学会的地理项目背景下，研究人员需要识别DNA片段的共同点。输入包括多个60碱基的序列，输出是最长的相同碱基子序列。当没有长度大于等于3的公共子序列时，输出特定提示。样例展示了不同情况的处理结果。

摘要由CSDN通过智能技术生成

地理项目是IBM和国家地理学会的合作研究项目，从成千上万捐献的DNA分析地球上人类是如何繁衍的。

作为一个IBM的研究人员，请你写一个程序找出给定的DNA片段之间的相同之处，使得对个体的调查相关联。

一个DNA碱基序列是指把在分子中发现的氮基的序列给罗列出来。有四种氮基：腺嘌呤 (A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(D)，例如，一个6碱基DNA序列可以表示为 TAGACC。

给出一个DNA碱基序列的集合，确定在所有序列中都出现的最长的碱基序列。

输入格式:
输入的第一行给出了整数n，表示测试数据集合的数目。每个测试数据集合由下述两部分组成：

一个正整数m(2≤m≤10)，给出数据集合中碱基序列的数目。

m行，每行给出一个60碱基的碱基序列。

输出格式:
对于输入的每个测试数据集合的所有的碱基序列，输出最长的相同的碱基子序列。

如果最长的相同的碱基子序列的长度小于3，则输出“no significant commonalities”来代替碱基子序列。

如果相同最长长度的子序列有多个，则仅输出按字母排序的第一个。

输入样例:
3
2
GATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
3
GATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATACCAGATA
GATACTAGATACTAGATACTAGATACTAAAGGAAAGGGAAAAGGGGAAAAAGGGGGAAAA
GATACCAGATACCAGATACCAGATACCAAAGGAAAGGGAAAAGGGGAAAAAGGGGGAAAA
3
CATCATCATCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
ACATCATCATAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AACATCATCATTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT

输出样例:
no significant commonalities
AGATAC
CATCATCAT

标签:
字符串，BF算法，KMP算法

来源：
ACM South Central USA 2006
code:

#include<stdio.h>
#include<string.h>
#define maxsize 80
 
void match(char c[][maxsize],int m)   ///二维数组c的行数为n

最低0.47元/天解锁文章

-CZN-

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

7-57-kmp模式匹配 碱基序列匹配 (25分)

7-57-kmp模式匹配碱基序列匹配 (25分)