KMP字符串匹配
给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
- 数据0:小规模字符串,测试基本正确性;
- 数据1:随机数据,String 长度为 105,Pattern 长度为 10;
- 数据2:随机数据,String 长度为 105,Pattern 长度为 102;
- 数据3:随机数据,String 长度为 105,Pattern 长度为 103;
- 数据4:随机数据,String 长度为 105,Pattern 长度为 104;
- 数据5:String 长度为 106,Pattern 长度为 105;测试尾字符不匹配的情形;
- 数据6:String 长度为 106,Pattern 长度为 105;测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 106 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 105 的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
代码:
#include<iostream>
#include<string>
using namespace std;
void buildnext(int next[] ,string match){
int n = match.size();
for(int i=1;i<n;i++){
int j = next[i-1];
while(j>=0 &&match[j+1]!= match[i]){
j = next[j];
}
if(match[j+1] == match[i]){
next[i] = j+1;
}
else{
next[i] = -1;
}
}
}
int kmp(string pattern, string match){
int m = pattern.size();
int n = match.size();
if(n > m){
return -1;
}
int s=0,p=0;
int next[n];
next[0] = -1;
buildnext(next,match); // 构造匹配移动数组
while(s < m && p < n){
if(pattern[s] == match[p]) {
s++;p++;
}
else if(p>0){
p = next[p-1]+1;
}
else{
s++;
}
}
return p == n? (s- p): -1;
}
int main(){
string pattern,match;
int n;
cin >> pattern;
scanf("%d",&n);
for(int i=0;i<n;i++){
cin>>match;
int p = kmp(pattern,match);
if(p == -1){
printf("Not Found");
}
else{
for(int i=p;i<pattern.size();i++){
cout<<pattern[i];
}
}
if(i!=n-1) cout<<endl;
}
return 0;
}