KMP 串的模式匹配
给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 10^6 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 10^5 的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
程序代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define STRINGLENGTH 1000000
#define PATTERNLENGTH 100000
typedef int Position;
#define NotFound -1
void BuildMatch(char *pattern, int *match);
Position KMP(char *string, char *pattern);
int main()
{
char string[STRINGLENGTH + 1];
char pattern[PATTERNLENGTH + 1];
int N, i;
Position p;
scanf("%s", string);
scanf("%d", &N);
for (i = 0; i < N; ++i) {
scanf("%s", pattern);
p = KMP(string, pattern);
if (p == NotFound) printf("Not Found\n");
else printf("%s\n", string + p);
}
return 0;
}
void BuildMatch(char *pattern, int *match)
{
Position i, j;
int m = strlen(pattern);
match[0] = -1;
for (j = 1; j < m; ++j) {
i = match[j - 1];
while ((i >= 0) && (pattern[i + 1] != pattern[j])) //这一行很绕。不会的话看视频或课件。
i = match[i]; /*https://www.icourse163.org/learn/ZJU-93001#/learn/content?type=detail&id=1214143659&cid=1217772612&replay=true*/
if (pattern[i + 1] == pattern[j])
match[j] = i + 1;
else match[j] = -1;
}
}
Position KMP(char *string, char *pattern)
{
int n = strlen(string);
int m = strlen(pattern);
Position s, p, *match;
if (n < m) return NotFound;
match = (Position *)malloc(sizeof(Position) * m);
BuildMatch(pattern, match);
s = p = 0;
while (s < n && p < m) {
if (string[s] == pattern[p]) {
++s; ++p;
}
else if (p > 0) p = match[p - 1] + 1;
else ++s;
}
free(match);
return (p == m) ? (s - m) : NotFound;
}