题目
KMP 字符串匹配算法比较
分数 25
作者 陈越
单位 浙江大学
给定两个由英文字母组成的字符串 string 和 pattern,要求找到 pattern 在 string 中第一次出现的位置,并将此位置后的 string 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
数据0:小规模字符串,测试基本正确性;
数据1:随机数据,String 长度为 10^5^ ,Pattern 长度为 10;
数据2:随机数据,String 长度为 10 ^5^ ,Pattern 长度为 10 ^2^ ;
数据3:随机数据,String 长度为 10 ^5^ ,Pattern 长度为 10 ^3^;
数据4:随机数据,String 长度为 10 ^5^,Pattern 长度为 10 ^4^;
数据5:String 长度为 10 ^6^,Pattern 长度为 10 ^5^ ,测试尾字符不匹配的情形;
数据6:String 长度为 10 ^6^,Pattern 长度为 10 ^5^,测试首字符不匹配的情形。
输入格式:
输入第一行给出 string,为由英文字母组成的、长度不超过 106的字符串。第二行给出一个正整数 n(≤10),为待匹配的模式串的个数。随后 n 行,每行给出一个 pattern,为由英文字母组成的、长度不超过 105的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
代码长度限制
16 KB
时间限制
400 ms
内存限制
64 MB
栈限制
8192 KB
解法
#include<stdio.h>
#include<string.h>
/*获得next数组的值*/
void getnext(int next[],int m,char pat[])
{
if(m==1)
{
next[0] = -1;
}
else
{
next[0] = -1;
next[1] = 0;
int i = 2;
int j = 0;
while(i<m)
if(pat[i-1]==pat[j])
next[i++] = ++j;
else if(j>0)
j = next[j];
else
next[i++] = 0;
}
}
void kmp(char s[],char pat[])
{
int M = strlen(pat);
int N = strlen(s);
int i=0,j=0;
int next[M];
getnext(next,M,pat);
while(i<N && j<M)
{
if(s[i] == pat[j])
{
i++;
j++;
}
else if(j==0)
{
i++;
}
else
{
j = next[j];
}
}
if(j==M)
printf("%s\n",s+i-j);
else
printf("Not Found\n");
}
int main()
{
char s[1000001],pat[100001];
int n;
gets(s);
scanf("%d",&n);
while(n--)
{
scanf("%s",pat);
kmp(s,pat);
}
}
KMP算法更多练习可以看LeetCode题目:找出字符串中第一个匹配项的下标
这里是题解