基于kmp算法的病毒检测,C语言数据结构

#include<stdio.h>
#include<iostream>
#include<algorithm>
#include<cstring>
#include<string.h>
#include<string>
#include<math.h>
using namespace std ;
typedef long long ll;
#define MAXN 1005
#define INF 0x3f3f3f3f

typedef struct Chunk
{
char goal[MAXN]; //存放单链DNA
char type[MAXN*2]; //存放病毒
char mo[MAXN]; //模式串存放更新
int next[MAXN]; //KMP中模式串的next[j];
int leg; //单链DNA的长度;
int let; //病毒基因的长度
int flag; //判断是否匹配成功
} SString;

int KMP(SString &T) //KMP算法
{
int i=0, j=0;
while(i<T.leg && j<T.let)
{
if(j == -1 || T.goal[i] == T.mo[j])
{
++i;
++j;
}
else
j = T.next[j];
}
if(j > T.let-1)
return i-T.let;
else
return -1;
}

void NNext(SString &T) //next[j];
{
memset(T.next, 0, sizeof(T.next));
int i=0, j=-1;
T.next[0] = -1;
while(i<T.let)
{
if(j == -1 || T.mo[i] == T.mo[j])
{
if(T.mo[++i] == T.mo[++j])
T.next[i] = T.next[j];
else
T.next[i] = j;
}
else
j = T.next[j];
}
}

void init(SString &T) //输入
{
T.flag = -1;
scanf("%s%s", T.type, T.goal);
T.leg = strlen(T.goal);
T.let = strlen(T.type);
int i, j;
for(i=T.let, j=0; j<T.let; ++j)
T.type[i++] = T.type[j];
}

void print(SString T) //输出
{
for(int i=0; i<T.let; ++i)
cout << T.type[i];
cout << ' ' << T.goal << ' ';
if(T.flag != -1)
cout << "Yes" << '\n';
else
cout << "No" << '\n';

}

int main()
{
int n;
cin >> n;
SString ss[n];
for(int i=0; i<n; ++i)
init(ss[i]);
for(int i=0; i<n; ++i)
{
for(int j=0; j<ss[i].let; ++j)
{
for(int k=0; k<ss[i].let; ++k) //模式串更新
ss[i].mo[k] = ss[i].type[k+j];
ss[i].mo[ss[i].let] = '\0'; //防止访问越界
NNext(ss[i]); //更新next[j];
ss[i].flag = KMP(ss[i]); //KMP查询
if(ss[i].flag != -1)
break;
}
}
cout<<"The result are as follows:"<<endl;
for(int i=0; i<n; ++i)
print(ss[i]);
return 0;
}

 

基于KMP(Knuth-Morris-Pratt)算法的树种病毒检测通常涉及字符串匹配问题,用于查找特定病毒序列是否存在于输入的树数据(如DNA序列、基因组等)。KMP算法是一种高效的模式搜索算法,通过构建部分前缀函数(失配函数)避免了回溯过程。 以下是一个简单的C++代码示例,展示了如何使用KMP算法进行树种病毒检测: ```cpp #include <iostream> #include <vector> #include <string> // 部分前缀函数计算 std::vector<int> computePrefixFunction(const std::string &pattern) { int n = pattern.length(); std::vector<int> prefix(n); for (int i = 1; i < n; ++i) { int j = prefix[i - 1]; while (j > 0 && pattern[j] != pattern[i]) { j = prefix[j - 1]; } if (pattern[j] == pattern[i]) { j++; } prefix[i] = j; } return prefix; } // KMP搜索函数 bool kmpSearch(const std::string &text, const std::string &pattern, const std::vector<int> &prefix) { int textIndex = 0, patternIndex = 0; while (textIndex < text.length() && patternIndex < pattern.length()) { if (patternIndex == 0 || text[textIndex] == pattern[patternIndex]) { textIndex++; patternIndex++; } else { if (prefix[patternIndex - 1] != 0) { patternIndex = prefix[patternIndex - 1]; } else { textIndex++; } } } return patternIndex == pattern.length(); } int main() { // 假设病毒序列就是"treeVirus" std::string virus = "treeVirus"; // 树的数据作为文本 std::string treeData; // 填充树数据(这里仅作示例,实际应用需要从文件或数据库读取) treeData = "ATGCATGCGTGTTC..."; // 省略一些随机生成的DNA序列 // 计算病毒的前缀函数 std::vector<int> prefix = computePrefixFunction(virus); // 搜索病毒是否存在 bool found = kmpSearch(treeData, virus, prefix); if (found) { std::cout << "Found the virus in the tree data." << std::endl; } else { std::cout << "Did not find the virus in the tree data." << std::endl; } return 0; } ``` 在这个例子中,我们首先计算病毒序列的前缀函数,然后在树数据中使用KMP搜索算法查找病毒。如果找到,`kmpSearch`函数会返回`true`,否则返回`false`。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值