字符串匹配算法(KMP)

1. KMP由来

  • 上一节说的BM算法是最高效、最常用的字符串匹配算法。
  • 最知名的却是KMP,它3位作者(D.E.Knuth,J.H.Morris,V.R.Pratt),算法的全称是Knuth Morris Pratt 算法,简称KMP算法。

2. KMP算法基本原理

类似于BM里的概念:坏字符(不能匹配的),好前缀(已经匹配的那段)

在这里插入图片描述
在这里插入图片描述

  • KMP算法目的:当遇到坏字符后,对于已经对比过的好前缀,将模式串多滑动几位
    在这里插入图片描述
    借一张图理解一下:
    在这里插入图片描述
    在这里插入图片描述
    上面可以看出,可以事先预处理好模式串,与主串比较时,直接用next数组

  • 构建next数组(失效函数)
    next 数组含义:当前字符之前的字符串(不含当前)中,最大长度的相同前缀后缀子串。如果next [j] = k,代表 j 之前的字符串中有最大长度为 k 的相同前缀后缀子串。

  • 失效函数计算方法
    方法1:暴力求解子串长度,效率低
    在这里插入图片描述
    方法2:
    case1
    在这里插入图片描述
    case2
    在这里插入图片描述
    如果 b[k] != b[j] , 则我要在前面部分里寻找能和包含 b[j] 的后缀匹配的最长前缀子串;
    b[k] 前面的最长匹配前缀长度就是 next[k],那么其后面一个字符就是 b[ next[k] ],如果它等于b[j],那么next[j+1] = next[k] + 1
    参考文献

3. 代码

王争的代码不好理解,找了书和别的人的代码参考

/**
 * @description: KMP字符串匹配算法
 * @author: michael ming
 * @date: 2019/6/22 17:15
 * @modified by: 
 */
#include <string>
#include <iostream>
using namespace std;
void calNexts(char *b, int m, int *next)
{
    next[0] = -1;
    int j = 0, k = -1;
    while(j < m)
    {
        if(k == -1 || b[j] == b[k])
        {
            j++;k++;
            next[j] = k;
        }
        else
            k = next[k];
    }
//    for(j = 0; j < m; ++j)//调试代码
//        cout << "next[" << j << "] " << next[j] << endl;
}
int str_kmp(char *a, int n, char *b, int m)
{
    int *next = new int [m];
    calNexts(b, m, next);
    int i = 0, j = 0;
    while(i < n && j < m)
    {
        if(j == -1 || a[i] == b[j])
        {
            i++;j++;
        }
        else
        {
            j = next[j];
        }
    }
    if(j == m)
    {
        delete [] next;
        return i-j;
    }
    delete [] next;
    return -1;
}
int main()
{
    string a = "abcacabcbcbaccba", b = "cbaccba";
    cout << a << "中第一次出现" << b << "的位置(从0开始)是:" << str_kmp(&a[0],a.size(),&b[0],b.size());
    return 0;
}

时间复杂度O(n+m),空间复杂度O(m)

4. Leetcode 28. 实现 strStr()

  • 使用 kmp 匹配
class Solution {
public:
    int strStr(string s, string p) {
        return kmp(s, p);
    }
    int kmp(string& s, string& p){
        int n1 = s.size(), n2 = p.size();
        vector<int> next(n2+1);
        calnext(p, next);
        int i = 0, j = 0;
        while(i < n1 && j < n2)
        {
            if(j == -1 || s[i] == p[j])
            {
                i++,j++;
            }
            else
                j = next[j];
        }
        if(j == n2)
            return i-j;
        return -1;
    }
    void calnext(string& p, vector<int>& next){
        int i = 0, j = -1;
        next[0] = -1;
        while(i < p.size())
        {
            if(j == -1 || p[i] == p[j])
            {
                i++,j++;
                next[i] = j;
            }
            else
                j = next[j];
        }
    }
};

0 ms 6.9 MB C++

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Michael阿明

如果可以,请点赞留言支持我哦!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值