4.5 广义表
4.6 案例分析与实现
BP算法
病毒感染检测(数据结构串,c语言版) -----jzdnkbd
原理图:
#include <stdio.h>
#include <stdlib.h>
#define MAXSIZE 255
typedef struct
{
char ch[MAXSIZE + 1];
int length;
}SString;
int getline(char s[], int limit);
int Index_BF(SString S, SString T, int pos);
int virus_matching(SString S, SString T);
int main()
{
SString S = { "a",1 };
SString T = { "a",1 };
int num = 1;
int flag = 0;
while (S.length > 0 && T.length > 0)
{
printf("请输入第%d对要匹配的人和病毒的DNA序列:\n", num);
printf("请输入第%d个人的DNA序列:", num);
S.length = getline(S.ch, MAXSIZE);
printf("请输入第%d个病毒的DNA序列:", num);
T.length = getline(T.ch, MAXSIZE);
flag = virus_matching(S, T);
printf("\n第%d对的匹配结果为:", num);
if (flag == 1)
{
printf("YES\n\n");
}
else if (flag == 0)
{
printf("No\n\n");
}
num++;
}
return 0;
}
int getline(char s[], int limit)
{
int i = 0;
int c = 0;
for (i = 0; i < limit - 1 && (c = getchar()) != EOF && c != '\n'; i++)
{
s[i] = c;
}
//一定不要加换行符'\n',因为换行符会算作一个字符存在数组中间,且返回的i会比实际元素个数多1
// 在后面将T连续存储两次之后,也会将换行符一并存储,当S和T比较到该换行符处时,就无法再正常进行该字符以及后面的比较。
//加不加结束符'\0'无所谓,因为系统不会将结束符算作一个元素。
return i; //此时返回的长度i正好是元素的个数
}
int Index_BF(SString S, SString T, int pos)
{
int i = pos;
int j = 1;
int k = 0;
//printf("T.length = %d\n", T.length);
while (i <= S.length && j <= T.length)
{
//printf("S.ch[i - 1] : S.ch[%d] = %c\n", i-1, S.ch[i - 1]);
//printf("T.ch[j - 1] : T.ch[%d] = %c\n", j - 1, T.ch[j - 1]);
if (S.ch[i - 1] == T.ch[j - 1])
{
++i;
++j;
//printf("BF算法if中 :i = %d\n", i);
//printf("BF算法if中 :j = %d\n", j);
}
else
{
i = i - j + 2;
j = 1;
//printf("BF算法else中 :i = %d\n", i);
//printf("BF算法else中 :j = %d\n", j);
}
}
//printf("BF算法中 :j = %d\n", j);
//printf("BF算法中 :T.length = %d\n", T.length);
if (j > T.length)
{
k = i - T.length;
//printf("k = %d", k);
return 1;
}
else
{
return 0;
}
}
int virus_matching(SString S, SString T)
{
int flag = 0;
//将字符串T连续存储两次
for (int k = 0; k < T.length; k++)
{
T.ch[T.length + k] = T.ch[k];
}
T.length = T.length*2;
printf("\nT中的元素为:");
for (int k = 1; k <= T.length; k++)
{
printf("%c ", T.ch[k - 1]);
}
printf("\n");
int i = 1; //原本T串的元素位置数
int j = 1; //新T串的元素位置数
SString temp = { "a",1 };
for (i = 1; i <= T.length; i++)
{
for (j = 1; j <= T.length / 2; j++)
{
temp.ch[j - 1] = T.ch[i - 1 + j - 1];
}
temp.length = T.length/2;
printf("\ntemp.length = %d", temp.length);
printf("\ntemp数组中的元素为:");
for (int k = 1; k <= temp.length; k++)
{
printf("%c ", temp.ch[k-1]);
}
printf("\nS中的元素为:");
for (int k = 1; k <= S.length; k++)
{
printf("%c ", S.ch[k - 1]);
}
flag = Index_BF(S, temp, 1);
printf("\nflag = %d\n", flag);
if (flag == 1)
{
break;
}
}
return flag;
}
KMP算法
#include <stdio.h>
#include <stdlib.h>
#define MAXSIZE 255
typedef struct
{
char ch[MAXSIZE + 1];
int length;
}SString;
int nextval[MAXSIZE];
int getline(char s[], int limit);
int Index_KMP(SString S, SString T, int pos);
void get_nextval(SString T, int nextval[]);
int virus_matching(SString S, SString T);
int main()
{
SString S = { "a",1 };
SString T = { "a",1 };
int num = 1;
int flag = 0;
while (S.length > 0 && T.length > 0)
{
printf("请输入第%d对要匹配的人和病毒的DNA序列:\n", num);
printf("请输入第%d个人的DNA序列:", num);
S.length = getline(S.ch, MAXSIZE);
printf("请输入第%d个病毒的DNA序列:", num);
T.length = getline(T.ch, MAXSIZE);
flag = virus_matching(S, T);
printf("\n第%d对的匹配结果为:", num);
if (flag == 1)
{
printf("YES\n\n");
}
else if (flag == 0)
{
printf("No\n\n");
}
num++;
}
return 0;
}
int getline(char s[], int limit)
{
int i = 0;
int c = 0;
for (i = 0; i < limit - 1 && (c = getchar()) != EOF && c != '\n'; i++)
{
s[i] = c;
}
//一定不要加换行符'\n',因为换行符会算作一个字符存在数组中间,且返回的i会比实际元素个数多1
// 在后面将T连续存储两次之后,也会将换行符一并存储,当S和T比较到该换行符处时,就无法再正常进行该字符以及后面的比较。
//加不加结束符'\0'无所谓,因为系统不会将结束符算作一个元素。
return i; //此时返回的长度i正好是元素的个数
}
void get_nextval(SString T, int nextval[])
{
nextval[1] = 0;
int i = 1;
int j = 0;
while (i <= T.length)
{
if (j == 0 || T.ch[i - 1] == T.ch[j - 1])
{
++i;
++j;
/* 在i、j分别自增之后,本来应该直接是next[i] = j;
这句命令的含义,用这里的符号就是:当模式串T中的第i个元素与主串S中的某个元素发生不匹配时,
应该将模式串T向右滑动至第j个字符与主串中的那某个元素对齐,再依次向后进行比较。
注意这里的i、j都是位置数,不是下标。 */
/* 但根据改进的next函数,只有模式串中的移动之后与主串中那某个字符对其的第next[i]个即第j个字符,
与移动之前与之对齐的第i个字符不相等时,才可将j赋值给next[i].
否则要继续对j进行next函数作用,直到模式串移动前后与主串中那某个字符对其的元素不相等,才将作用后j赋值给next[i].。*/
if (T.ch[i - 1] != T.ch[j - 1]) //注意此时i,j分别增加了一个位置
{
nextval[i] = j;
}
else
{
nextval[i] = nextval[j];
/* 这里用了nextval[j],也是会对j不断进行next函数作用。
即nextval[i]可能为nextval[j],也可能是nextval[nextval[j]]、nextval[nextval[nextval[j]]] */
}
}
else
{
j = nextval[j];
}
}
printf("\nnextval数组中的元素为:");
for (int n = 0; n <= T.length; n++)
{
printf("%d ", nextval[n]);
}
}
int Index_KMP(SString S, SString T, int pos)
{
int i = pos;
int j = 1;
int k = 0;
get_nextval(T, nextval);
while (i <= S.length && j <= T.length)
{
if (j == 0 || S.ch[i - 1] == T.ch[j - 1])
{
++i;
++j;
}
else
{
j = nextval[j]; //i不变,且next数组中有效的值从第二个值next[1] = 0开始
}
}
if (j > T.length)
{
k = i - T.length;
printf("\nk = %d", k);
return 1;
}
else
{
return 0;
}
}
int virus_matching(SString S, SString T)
{
int flag = 0;
//将字符串T连续存储两次
for (int k = 0; k < T.length; k++)
{
T.ch[T.length + k] = T.ch[k];
}
T.length = T.length * 2;
printf("\nT中的元素为:");
for (int k = 1; k <= T.length; k++)
{
printf("%c ", T.ch[k - 1]);
}
printf("\n");
int i = 1; //原本T串的元素位置数
int j = 1; //新T串的元素位置数
SString temp = { "a",1 };
for (i = 1; i <= T.length; i++)
{
for (j = 1; j <= T.length/2; j++)
{
temp.ch[j - 1] = T.ch[i - 1 + j - 1];
}
temp.length = T.length / 2;
printf("\ntemp.length = %d", temp.length);
printf("\ntemp数组中的元素为:");
for (int k = 1; k <= temp.length; k++)
{
printf("%c ", temp.ch[k - 1]);
}
printf("\nS中的元素为:");
for (int k = 1; k <= S.length; k++)
{
printf("%c ", S.ch[k - 1]);
}
flag = Index_KMP(S, temp, 1);
printf("\nflag = %d\n", flag);
if (flag == 1)
{
break;
}
}
return flag;
}