给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
数据0:小规模字符串,测试基本正确性;
数据1:随机数据,String 长度为 10
5
,Pattern 长度为 10;
数据2:随机数据,String 长度为 10
5
,Pattern 长度为 10
2
;
数据3:随机数据,String 长度为 10
5
,Pattern 长度为 10
3
;
数据4:随机数据,String 长度为 10
5
,Pattern 长度为 10
4
;
数据5:String 长度为 10
6
,Pattern 长度为 10
5
;测试尾字符不匹配的情形;
数据6:String 长度为 10
6
,Pattern 长度为 10
5
;测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 10
6
的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 10
5
的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
成功代码:
#include <iostream>
#include <cstring>
using namespace std;
const int N = 1000010 ,P = 13331;
typedef unsigned long long ull;
int n, m;
char str[N];
ull h[N],p[N];
char str1[N];
ull h1[N],p1[N];
ull get(int l,int r)
{
return h[r] - h[l-1] * p[r-l+1];
}
int main()
{
// cin>>str+1;
scanf("%s",str+1);
n = strlen(str+1);
p[0] = 1;
for(int i=1;i<=n;i++)
{
h[i] = h[i-1] * P + str[i];
p[i] = p[i-1] * P;
}
int t;
scanf("%d",&t);
while(t--)
{
// cin >> str1+1;
scanf("%s",str1+1);
m = strlen(str1+1);
p1[0] = 1;
for(int i = 1;i<=m;i++)
{
h1[i] = h1[i-1]*P + str1[i];
// cout << "h1[i] = "<< h1[i] << endl;
p1[i] = p1[i-1]*P;
}
ull t1 = h1[m];
bool tf = true;
for(int i = m;i<=n;i++)
{
if(get(i-m+1,i)==t1)
{
// cout<< str + i-m+1<< endl;
printf("%s\n",str+i-m+1);
tf = false;
break;
}
}
if(tf)
printf("Not Found\n");
}
return 0;
}