KMP 串的模式匹配 (25 分)
给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
- 数据0:小规模字符串,测试基本正确性;
- 数据1:随机数据,String 长度为 105,Pattern 长度为 10;
- 数据2:随机数据,String 长度为 105,Pattern 长度为 102;
- 数据3:随机数据,String 长度为 105,Pattern 长度为 103;
- 数据4:随机数据,String 长度为 105,Pattern 长度为 104;
- 数据5:String 长度为 106,Pattern 长度为 105;测试尾字符不匹配的情形;
- 数据6:String 长度为 106,Pattern 长度为 105;测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 106 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 105 的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
void Match1(char* Pattern, int* Match);
char* KMP(char* Pattern, char* String);
#define NotFound NULL
char a[1000001];
char b[100001];
int main()
{
scanf("%s", a);
int N;
scanf("%d", &N);
for (int i = 0; i < N; i++)
{
scanf("%s",b);
char* c = KMP(b, a);
if (c != NotFound)
printf("%s\n", c);
else
printf("Not Found\n");
}
}
void Match1(char* Pattern, int* Match)
{
Match[0] = -1;
int m = strlen(Pattern);
for (int j = 1; j < m; j++)
{
int i = Match[j - 1];
while (i >= 0&& Pattern[i + 1] != Pattern[j])
{
i = Match[i]; //Pattern[i]==Pattern[j-1]
}
if (Pattern[i + 1] != Pattern[j])
{
Match[j] = -1;
}
else {
Match[j] = i + 1;
}
}
}
char* KMP(char* Pattern, char* String)
{
int P = 0;
int S = 0;
int L1 = strlen(String);
int L2 = strlen(Pattern);
int* Match = (int*)malloc(sizeof(int) * L2);
Match1(Pattern, Match);
while (S < L1 && P< L2)
{
if (Pattern[P] == String[S])
{
P++;
S++;
}
else if (P > 0)
P = Match[P - 1]+1;
else
S++;
}
if (P == L2)
return String + S-L2;
else
return NULL;
}