09字符串KMP匹配

字符串KMP匹配

KMP算法是什么

next数组:是当该字符与主串发生不匹配后,值对应索引的字符要移动到跟主串不匹配的字符对齐。
数组的计算方法:公共前后缀–前面和后面是一样的。next = 公共前后缀 + 1。

较于暴力匹配有哪些改进

KMP是一种高效的模式匹配算法,他牺牲了一定的空间去保存next数组,提高了匹配效率。KMP算法还能更加智能的移动字符串,使字符串匹配。

实现

初始化串

#include <stdio.h>
#include <stdlib.h>

typedef struct String (
    char* data;
    int len;
) String;

String* initString() {
    String* s = (String*)malloc(sizeof(String));
    s -> data = NULL;
    s -> len = 0;
    return s; 
}

void stringAssign(String* s, char* data) {
    if (s ->data) {
        free(s -> data);
    }
    int len = 0;
    char* temp = data;
    while(*temp) {
        len++;
        temp++
    }
    if (len == 0) {
        s -> data = NULL;
        s -> len = 0;
    } else {
        temp = data;
        s -> len = len;
        s -> data = (char*)malloc(sizeof(char * (len + 1)));
        for (int i = 0; i<n; i++, temp++) {
            s -> data[i] = *temp;
        }
    }
}

void printString(String* s) {
    for (int i = 0; i< s -> len; i++) {
        printf(i == 0 ? "%c " : "-> %c ", s -> data[i];)
    }
    printf("\n");
}

int main(int argc, char* argv[]) 
{
    String* master = initString();
    String* sub = initString();
    StringAssign(master, argv[1]);
    StringAssign(sub, argv[2]);
    int* next = getNext(master);
    printNext(next, master -> len);

    return 0;
}

求next数组

后一个next值可以根据前一个next值推断

int* getNext(String* s) {
    int* next = (int*)malloc(sizeof(int) * s -> len);
    int i = 0;//字符串的索引
    int j = -1;//next数组的值
    next[i] = j;
    while(i < s -> len - 1) {
        if (j == -1 || s -> data[i] == s -> data[j]) {
            i++;
            j++;
            next[i] = j;
        } else {
            j = next[i]
        }
    }
    return next;
}

void printNext(int* next, int* len) {
    for (int i = 0; i< len; i++) {
        printf(i == 0 ? "%d " : "-> %d ", next[i]);
    }
    printf("\n");
}

KMP匹配

void kmpMatch(String* master, String* sub) {
    int i = 0;
    int j = 0;
    while(i < master -> len && j < sub -> len) {
        if (master -> data[i] == sub -> data[i]) {
            i++;
            j++;
        } else {
            j = next[i];
        }
    }
    if (j == sub -> len) {
        printf("KMP match succes.\n");
    } else {
        printf("KMP match fail.\n");
    }
}
  • 8
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
KMP算法是一种用于字符串匹配算法,它的核心思想是利用部分匹配表来避免不必要的比较。下面是KMP算法的原理和实现步骤: 1. 部分匹配表的计算: - 部分匹配值是指字符串的前缀和后缀的最长公共部分的长度。 - 部分匹配表是一个数组,记录了每个位置的部分匹配值。 - 部分匹配表的计算可以通过动态规划的方式进行,具体步骤如下: - 初始化部分匹配表的第一个元素为0。 - 从第二个元素开始,依次计算每个位置的部分匹配值: - 如果当前位置的字符与前一个位置的部分匹配值对应的字符相等,则部分匹配值加1。 - 如果不相等,则需要回溯到前一个位置的部分匹配值对应的字符的部分匹配值,继续比较。 - 在主串中从左到右依次比较字符,同时在模式串中根据部分匹配表进行跳跃。 - 如果当前字符匹配成功,则继续比较下一个字符。 - 如果当前字符匹配失败,则根据部分匹配表找到模式串中需要跳跃的位置,继续比较。 下面是一个使用KMP算法进行字符串匹配的示例代码: ```python def kmp_search(text, pattern): n = len(text) m = len(pattern) next = get_next(pattern) i = 0 j = 0 while i < n and j < m: if j == -1 or text[i] == pattern[j]: i += 1 j += 1 else: j = next[j] if j == m: return i - j else: return -1 def get_next(pattern): m = len(pattern) next = [-1] * m i = 0 j = -1 while i < m - 1: if j == -1 or pattern[i] == pattern[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值