KMP 串的模式匹配 (25 分)
给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 1 的字符串。第二行给出一个正整数 N(≤),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 1 的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
Note
- match数组存储查询失败时下一个要比较的位置
- buildmatch重点原理
3. 实现时莫名犯了一些错误,例如match的循环从 0 开始,导致所有结果超时查了半天没查出来
Code
#include<iostream>
#include<cstring>
using namespace std;
#define MAX 1000001
void Match(char *pattern, int *match){
int n = strlen(pattern);
match[0] = -1;
for(int i = 1; i < n; i++){
int last = match[i - 1];
while(last >= 0 && pattern[last + 1] != pattern[i]) last = match[last];
if(pattern[last+1] == pattern[i] ) match[i] = last + 1;
else match[i] = -1;
}
}
int main() {
int match[MAX];
char mystring[MAX], pattern[MAX];
//scanf("%s",(char *) mystring);
scanf("%s", mystring);
int n = strlen(mystring);
int num;
scanf("%d", &num);
while(num--){ // KMP
scanf("%s", pattern);
//scanf("%s", (char *)pattern);
int m = strlen(pattern);
Match(pattern, match);
if(n < m) {printf("Not Found\n"); continue;}
int s = 0, p = 0;
while(s < n && p < m){ //s -> mystring p -> pattern
if(mystring[s] == pattern[p]){ s++; p++;}
else if(p > 0) p = match[p - 1] + 1;
else s++;
}
if(p == m){
printf("%s\n", mystring + s - m);
}
else printf("Not Found\n");
}
return 0;
}
同类别题目:next[i]
Problem Description
在字符串匹配的KMP算法中有一个重要的概念是next数组,求解它的过程让不少同学伤透了心。next数组的直接语义其实是:使“长度为L的前缀”与“长度为L的后缀”相同的最大L,且满足条件的前后缀不能是原字符串本身。
例如对字符串"ababa"来说,长度为1的前缀与后缀都是"a",它们相同;长度为2的前缀与后缀分别是"ab"和"ba",它们不相同;长度为3的前缀与后缀都是"aba",它们相同;长度为4的前缀与后缀分别是"abab"和"baba",它们不相同。因此对字符串"ababa"来说,使“长度为L的前缀”与“长度为L的后缀”相同的最大L是3。
现在我们把这个最大的L值称为原字符串S的next值。在此概念的基础上,对给定的字符串S,下标为从1到N,那么next[i]就是指子串S[1…i]的next值。
现在给定一个字符串,下标从1到N,然后给一个下标i,求next[i]。
Input
每个输入文件一组数据。
只有一行,输入一个仅由小写字母组成的长度为N(1<=N<=100)的字符串、与一个下标i(1<=i<=N)。
Output
一个整数,即next[i]。
Sample Input 1
ababa 5
Sample Output 1
3
Sample Input 2
ababab 4
Sample Output 2
2
Sample Input 3
ab 2
Sample Output 3
0
Author
Shoutmon
Source
19浙大考研机试模拟赛
Note
- 自己单独写一遍才知道还有很多问题 例如 if else 的位置不能换, 不然全是-1
- next[i] = last + 1 而不是 next[i] = next[last] + 1
#include<iostream>
#include<cstring>
using namespace std;
int main(){
char pattern[101];
int index, next[101];
scanf("%s %d", pattern, &index);
next[0] = -1;
for(int i = 1; i <= index; i++){
int last = next[i - 1];
while(last >= 0 && pattern[last + 1] != pattern[i]) last = next[last];
if(pattern[last + 1] == pattern[i]) next[i] = last + 1;
else next[i] = -1;
}
printf("%d", next[index - 1] + 1);
return 0;
}