KMP 串的模式匹配

数据结构 专栏收录该内容
18 篇文章 0 订阅

KMP 串的模式匹配

来自:PTA_数据结构_KMP 串的模式匹配

给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。

本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:

在这里插入图片描述

输入格式:

输入第一行给出 String,为由英文字母组成的、长度不超过 10^6 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 10^​5 的字符串。每个字符串都非空,以回车结束。

输出格式:

对每个 Pattern,按照题面要求输出匹配结果。

输入样例:

abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz

输出样例:

abcabcacabxy
Not Found
Not Found

程序代码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define STRINGLENGTH 1000000
#define PATTERNLENGTH 100000

typedef int Position;
#define NotFound -1

void BuildMatch(char *pattern, int *match);
Position KMP(char *string, char *pattern);

int main()
{
    char string[STRINGLENGTH + 1];
    char pattern[PATTERNLENGTH + 1];
    int N, i;
    Position p;
    scanf("%s", string);
    scanf("%d", &N);

    for (i = 0; i < N; ++i) {
        scanf("%s", pattern);
        p = KMP(string, pattern);
        if (p == NotFound) printf("Not Found\n");
        else printf("%s\n", string + p);
    }

    return 0;
}

void BuildMatch(char *pattern, int *match)
{
    Position i, j;
    int m = strlen(pattern);
    match[0] = -1;

    for (j = 1; j < m; ++j) {
        i = match[j - 1];
        while ((i >= 0) && (pattern[i + 1] != pattern[j]))  //这一行很绕。不会的话看视频或课件。
            i = match[i];   /*https://www.icourse163.org/learn/ZJU-93001#/learn/content?type=detail&id=1214143659&cid=1217772612&replay=true*/
        if (pattern[i + 1] == pattern[j])
            match[j] = i + 1;
        else match[j] = -1;
    }
}

Position KMP(char *string, char *pattern)
{
    int n = strlen(string);
    int m = strlen(pattern);
    Position s, p, *match;

    if (n < m) return NotFound;
    match = (Position *)malloc(sizeof(Position) * m);
    BuildMatch(pattern, match);
    s = p = 0;
    while (s < n && p < m) {
        if (string[s] == pattern[p]) {
            ++s; ++p;
        }
        else if (p > 0) p = match[p - 1] + 1;
        else ++s;
    }
    free(match);
    return (p == m) ? (s - m) : NotFound;
}
  • 0
    点赞
  • 0
    评论
  • 0
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

相关推荐
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值