给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
- 数据0:小规模字符串,测试基本正确性;
- 数据1:随机数据,String 长度为 105,Pattern 长度为 10;
- 数据2:随机数据,String 长度为 105,Pattern 长度为 102;
- 数据3:随机数据,String 长度为 105,Pattern 长度为 103;
- 数据4:随机数据,String 长度为 105,Pattern 长度为 104;
- 数据5:String 长度为 106,Pattern 长度为 105;测试尾字符不匹配的情形;
- 数据6:String 长度为 106,Pattern 长度为 105;测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 106 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 105 的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
AC代码:
#include<bits/stdc++.h>
using namespace std;
void GetNext(string t,int next[]) {
int j=0,k=-1;
next[0]=-1;
while(j<t.length()) {
if(k==-1||t[j]==t[k]) {
j++;
k++;
next[j]=k;
} else k=next[k];
}
}
int KMP(string s,string t,int next[]) {
int n=s.length(),m=t.length();
int j=0,i=0;
while(i<n&&j<m) {
if(j==-1||s[i]==t[j]) {
i++;
j++;
} else j=next[j];
}
if(j>=m) {
return i-m;
} else return -1;
}
int main() {
string s,t;
int n;
cin>>s;
cin>>n;
while(n--) {
cin>>t;
int next[100000];
GetNext(t,next);
if(KMP(s,t,next)!=-1) {
cout<<s.substr(KMP(s,t,next))<<endl;
} else cout<<"Not Found"<<endl;
}
return 0;
}
GetNext函数是数据结构教程copy的,稍微改良了一下。
目前以我的能力,next数组只能放在main()内,如果放在外面,在pta会显示编译错误。
然后这道题很鸡肋是事情之一:写着串的模式匹配,不该用BF算法嘛,用BF会超时;用BMP不会超时。
BF算法超时代码:如果有大佬路过,请帮忙改一下!thank you!
#include<bits/stdc++.h>
using namespace std;
int main(){
string s;
int n;
cin>>s;
cin>>n;
while(n--){
int i=0,j=0;string t;
cin>>t;
while(i<s.length()&&j<t.length()){
if(s[i]==t[j]){
i++;j++;
}
else {
i=i-j+1;
j=0;
}
}
if(j>=t.length()){
string temp=s.substr(i-t.length());
cout<<temp<<endl;
}
else {
cout<<"Not Found"<<endl;
}
}
return 0;
}