字符串-KMP算法

1. KMP算法

1.1 简介

  • KMP定义:三人名字首字母
  • 解决的问题:字符串匹配,检查模式串是否存在于主串当中,相比暴力求解复杂度O(m*n),有更好的求解效率

KMP的重点就在于当某一个字符与主串不匹配时,我们应该知道j指针要移动到哪?

1.2 关键问题

  • next数组
    • 前缀表求解
    • 求解思路
  1. 初始化
  2. 前后缀不同
  3. 前后缀相同
  • 为什么next数组第一个元素的值要改为-1?
    • 假设某模式串第一个元素为0,此时匹配到的就是0,当模式串第一个元素和主串中的值不匹配的时候,模式串只可以继续跳转到0位置上继续进行匹配,就形成了一个循环,相当于只有模式串移动而无主串的移动。
    • 当第一个元素为-1时,表示主串中当前元素与模式串第一个元素无法匹配,故主串移动而非模式串移动。

1.3 具体实现

1.3.1 构造next数组

  1. 重要参数定义
    i:后缀终止位置
    j:前缀终止位置

  2. 初始化
    j初始化为-1
    next[0]为-1,

  3. 前后缀不相等
    表示当模式串匹配到i,i与下标为(j+1)的元素不匹配,前后缀连续匹配终端,此时连续长度变短,即j要变为next[j]的值,即该串的前缀的前缀长度,由于前缀的前缀和后缀相等,而前缀和后缀相等,所以后缀的前缀和后缀的后缀相等,即前缀的前缀和后缀的后缀相等,这样的好处是避免了重复的前后匹配过程。当遇到不匹配可以直接跳过前面相同前后缀的匹配
    下标为0,1,2,…,i-1的数组元素中前后缀相同元素为j

  4. 前后缀相等
    在前一个子串的基础上+1,即前面的前后缀匹配长度已经确定,只要在前面匹配前缀长度基础上加1即可。

当匹配失败时,j要移动的下一个位置k。存在着这样的性质:最前面的k个字符和j之前的最后k个字符是一样的。如果用数学公式来表示是这样的
P[0 ~ k-1] == P[j-k ~ j-1]在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.3.2 代码实现

void getNext(int* next, const string& s) {
        int j = -1;
        next[0] = j;
        for(int i = 1; i < s.size(); i++) { // 注意i从1开始
            while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
                j = next[j]; // 向前回溯
            }
            if (s[i] == s[j + 1]) { // 找到相同的前后缀
                j++;
            }
            next[i] = j; // 将j(前缀的长度)赋给next[i]
        }
    }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值