题目:
给出几组人的DNA序列(如abcabcd),以及几组病毒的DNA序列(bca),已知其中病毒DNA都是环状的。检测该人体的DNA中是否含有病毒的DNA序列。
思路:
该问题为典型的字符串匹配问题,可以采用BF算法或者KMP算法。由于病毒DNA为环状的,所以可以设一个字符串为它的2倍长。
如病毒DAN:abc 设一个temp为:abcabc,从中依次取出长度为3的字符串:abc,bca,cab,abc 这样就相当于绕了一圈。
#include <iostream>
using namespace std;
/**字符串匹配,找出子串在主串中的位置*/
int BF(char * parent,char * child)
{
int i = 0,j = 0;
int index = 0;
while(parent[i]!='\0'&&child[j] != '\0')
{
if(parent[i] == child[j])
{
i++;
j++;
}
else
{
index++;
i = index;
j = 0;
}
}
if(child[j] == '\0')
return index + 1;
else return 0;
}
int check(char * parent,char * child)
{
int len_child = 0;
while(child[len_child]!='\0')
len_child++;//计算子串长度
char temp[len_child * 2 + 1];//由于virus的DNA是环状的 所以长度变为2倍来匹配如acb 变为acbacb
for(int i = 0;i < len_child * 2;i++)
temp[i] = child[i % len_child];//赋值
temp[len_child*2] = '\0';
for(int i = 0;i < len_child ;i++)
{
char virus[len_child+1];//截取病毒长度的片段,用于匹配
//acbacb: acb cba bac acb
for(int j = i; j < i+len_child;j++)//长度为len_child ,所以小于i+len_child
{
virus[j-i] = temp[j];//求virus[0~2]
}
virus[len_child] = '\0';
if(BF(parent,virus)!=0) //与主串匹配上则可以返回不用再进行了
return 1;
}
//都没有匹配上
return 0;
}
int main()
{
//病毒感染检测
char * persons[] = {
"bbaabbba","aaabbbba","efghkkl","cabbbbab","abcbacbac"
};
char * virus[] ={
"acb","fghk","aba","bbba","acc"
};
for(int i = 0;i < 5;i++)
{
for(int j = 0;j < 5;j++)
{
if(check(persons[i],virus[j]) != 0)
{
cout << "人类DNA:" << persons[i] << " 匹配上的病毒:" << virus[j]<<endl;
}
}
}
return 0;
}