7-3 串的模式匹配
给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
• 数据0:小规模字符串,测试基本正确性;
• 数据1:随机数据,String 长度为 105,Pattern 长度为 10;
• 数据2:随机数据,String 长度为 105,Pattern 长度为 102;
• 数据3:随机数据,String 长度为 105,Pattern 长度为 103;
• 数据4:随机数据,String 长度为 105,Pattern 长度为 104;
• 数据5:String 长度为 106,Pattern 长度为 105;测试尾字符不匹配的情形;
• 数据6:String 长度为 106,Pattern 长度为 105;测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 106 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 105 的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
kmp算法:
#include<iostream>
using namespace std;
int Next[100005]={0};
void GetNext(string a)
{
int len=a.length();
int i=0;
int j=-1;
Next[0]=-1;
while(i<len-1)
{
if(j==-1||a[i]==a[j])
{
i++;
j++;
Next[i]=j;
}else
j=-1;
}
}
int kmp(string a,string b)
{
GetNext(b);
int i=0;//a
int j=0;//b
int len1=a.length();
int len2=b.length();
while(i<len1&&j<len2)
{
if(j==-1||a[i]==b[j])
{
i++;
j++;
}else
j=Next[j];
}
if(j==len2)
return i-j;
return -1;
}
int main()
{
string a,b;
int n;
cin>>a;
cin>>n;
while(n--)
{
cin>>b;
int index=kmp(a,b);
if(index!=-1)
cout<<a.substr(index)<<endl;
else
cout<<"Not Found"<<endl;
}
return 0;
}
参考资料 —>kmp算法(自用)
strstr()水过:
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
int main(){
char* p;
int n, i = 0;
string s,l;
cin>>s>>n;
while(n--){
cin>>l;
p = strstr(s.c_str(), l.c_str());
if(p)
cout<<p<<endl;
else
cout<<"Not Found"<<endl;
}
return 0;
}
strstr()的最坏复杂度是n2,但是一般情况下效率极高,kmp只有对特别挑剔的数据才有优势.