KMP 串的模式匹配 (25 分)

KMP 串的模式匹配 (25 分)

给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。

本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
数据0:小规模字符串,测试基本正确性;数据1:随机数据,String 长度为 1,Pattern 长度为 1;数据2:随机数据,String 长度为 1,Pattern 长度为 1;数据3:随机数据,String 长度为 1,Pattern 长度为 1;数据4:随机数据,String 长度为 1,Pattern 长度为 1;数据5:String 长度为 1,Pattern 长度为 1;测试尾字符不匹配的情形;数据6:String 长度为 1,Pattern 长度为 1;测试首字符不匹配的情形。

输入格式:

输入第一行给出 String,为由英文字母组成的、长度不超过 1 的字符串。第二行给出一个正整数 N(≤),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 1 的字符串。每个字符串都非空,以回车结束。

输出格式:

对每个 Pattern,按照题面要求输出匹配结果。

输入样例:

abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz

输出样例:

abcabcacabxy
Not Found
Not Found

Note

  1. match数组存储查询失败时下一个要比较的位置
  2. buildmatch重点原理

在这里插入图片描述
3. 实现时莫名犯了一些错误,例如match的循环从 0 开始,导致所有结果超时查了半天没查出来

Code

#include<iostream>
#include<cstring>
using namespace std;
#define MAX 1000001
void Match(char *pattern, int *match){
    int n = strlen(pattern);
    match[0] = -1;
    for(int i = 1; i < n; i++){
        int last = match[i - 1];
        while(last >= 0 && pattern[last + 1] != pattern[i]) last = match[last];
        if(pattern[last+1] == pattern[i] ) match[i] = last + 1;
        else match[i] = -1;
    }
}
int main() {
    int match[MAX];
    char mystring[MAX], pattern[MAX];
    //scanf("%s",(char *) mystring);
    scanf("%s", mystring);
    int n = strlen(mystring);
    int num;
    scanf("%d", &num);
    while(num--){                     // KMP
        scanf("%s", pattern);
        //scanf("%s", (char *)pattern);
        int m = strlen(pattern);
        Match(pattern, match);
        if(n < m) {printf("Not Found\n"); continue;}
        int s = 0, p = 0;
        while(s < n && p < m){        //s -> mystring  p -> pattern
            if(mystring[s] == pattern[p]){ s++; p++;}
            else if(p > 0) p = match[p - 1] + 1;
            else s++;
        }
        if(p == m){
            printf("%s\n", mystring + s - m);
        }
		else printf("Not Found\n");      
    }
	return 0;
}

同类别题目:next[i]

Problem Description

在字符串匹配的KMP算法中有一个重要的概念是next数组,求解它的过程让不少同学伤透了心。next数组的直接语义其实是:使“长度为L的前缀”与“长度为L的后缀”相同的最大L,且满足条件的前后缀不能是原字符串本身。

例如对字符串"ababa"来说,长度为1的前缀与后缀都是"a",它们相同;长度为2的前缀与后缀分别是"ab"和"ba",它们不相同;长度为3的前缀与后缀都是"aba",它们相同;长度为4的前缀与后缀分别是"abab"和"baba",它们不相同。因此对字符串"ababa"来说,使“长度为L的前缀”与“长度为L的后缀”相同的最大L是3。

现在我们把这个最大的L值称为原字符串S的next值。在此概念的基础上,对给定的字符串S,下标为从1到N,那么next[i]就是指子串S[1…i]的next值。

现在给定一个字符串,下标从1到N,然后给一个下标i,求next[i]。

Input

每个输入文件一组数据。

只有一行,输入一个仅由小写字母组成的长度为N(1<=N<=100)的字符串、与一个下标i(1<=i<=N)。

Output

一个整数,即next[i]。

Sample Input 1

ababa 5

Sample Output 1

3

Sample Input 2

ababab 4

Sample Output 2

2

Sample Input 3

ab 2

Sample Output 3

0

Author

Shoutmon

Source

19浙大考研机试模拟赛

Note

  1. 自己单独写一遍才知道还有很多问题 例如 if else 的位置不能换, 不然全是-1
  2. next[i] = last + 1 而不是 next[i] = next[last] + 1
#include<iostream>
#include<cstring>
using namespace std;
int main(){
    char pattern[101];
    int index, next[101];
    scanf("%s  %d", pattern, &index);
    next[0] = -1;
    for(int i = 1; i <= index; i++){
        int last = next[i - 1];
        while(last >= 0 && pattern[last + 1] != pattern[i]) last = next[last];
		if(pattern[last + 1] == pattern[i]) next[i] = last + 1;
		else next[i] = -1;

    }
    printf("%d", next[index - 1] + 1);
	return 0; 
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值