问题描述
给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
数据0:小规模字符串,测试基本正确性;
数据1:随机数据,String 长度为 10的5次方,
Pattern 长度为 10;
数据2:随机数据,String 长度为 10的5次方,
Pattern 长度为 10的2次方;
数据3:随机数据,String 长度为 10的5次方,
Pattern 长度为 10的3次方;
数据4:随机数据,String 长度为 10的5次方,
Pattern 长度为 10的4次方;
数据5:String 长度为 10的6次方,
Pattern 长度为 10的5次方;
测试尾字符不匹配的情形;
数据6:String 长度为 10的6次方,
Pattern 长度为 10的5次方;
测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 10
6
的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 10
5
的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
代码实现:
#include<iostream>
#include<vector>
#include<string>
using namespace std;
class Solution{
public:
void getNext(int *next, const string &Pattern) {
int j = -1;
next[0] = j;
for (int i = 1; i < Pattern.size(); i++) {
while(j >= 0 && Pattern[i] != Pattern[j+1]){
j = next[j];
}
if (Pattern[i] == Pattern[j+1]) j++;
next[i] = j;
}
}
int Strstr(string String, string pattern) {
if (pattern.size() == 0) return -1;
int j = -1;
int Next[pattern.size()];
getNext(Next,pattern);
for (int i = 0; i < String.size(); i++) {
while(j >= 0 && String[i] != pattern[j+1]){
j = Next[j];
}
if (String[i] == pattern[j+1]) j++;
if (j == (pattern.size()-1))
return (i-pattern.size()+1);
}
return -1;
}
};
int main() {
int n;
Solution Q;
string str;
cin>>str;
cin>>n;
while(n--) {
string s;
cin>>s;
int t = Q.Strstr(str,s);
if (t >= 0) {
string s2 = str.substr(t,str.size()-t);
cout<<s2<<endl;
}
else cout<<"Not Found"<<endl;
}
}
什么是KMP算法,请参考KMP算法