KMP算法

本文详细介绍了KMP算法,包括next数组的计算原理和在字符串匹配中的应用。重点讲解了如何通过next数组减少匹配次数,以及通过实例演示算法步骤。此外,还涵盖了时间复杂度和空间复杂度的讨论以及代码实现。
摘要由CSDN通过智能技术生成

什么是KMP算法

        KMP算法一种改进的字符串匹配算法(即在主串中查找模式串的位置),KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。

next数组是什么,怎么求:

        next数组存放模式串的公共前后缀,通俗来说就是存放模式串从下标为0开始到下标为i的子串s1的最长的(从0开始的子串s11与末尾为i的子串s12相等的)子串s11的长度。

        如ababa,当i为3时,子串s1为abab,其中长度为3的子串s11:aba与子串s12:bab不相等,长度为2的子串s11:ab与s12:ab相等。所以next[3] = 2。

        那么next数组有什么用呢?当我们遍历到模式串的下标j与主串的下标i刚好不相等时(假设j前与i前的元素均相等)。模式串的前next[j-1]个元素与主串的i前next[j-1]个元素相等。这个我不懂怎么表达,就用例子来说好了:假设主串为:abababcab,模式串为ababc。当j=4时,i=4。两者代表的元素并不相等。但是由于next[4] = 2(在上一段)。所以模式串的第一、二个元素与主串的第三、四个元素相等。因为已经匹配到i和j了,说明第模式串下标为j-1和j-2的元素与主串下标为i-1和i-2的元素相等。由于next[j-1]=2,所以模式串下标为0、1的元素与下标为j-2、j-1的元素相等。故模式串下标为0、1的元素与主串下标为i-2、i-1的元素相等,只需从模式串下标j为next[j-1]开始与主串下标为i的元素进行匹配。

KMP算法的具体实现:

        先求出模式串的next数组。再遍历主串,将模式串的元素与主串的元素一一对比,如果相等则对比下一个元素,否则先判断是否是对模式串的第一个元素进行对比,如果是,则直接与主串的下一个元素对比;如果不是,则让模式串上一个元素的next值与主串的元素对比。循环判断直到模式串匹配成功或者主串元素已被遍历完成,匹配失败。

时间复杂度:

        O(m+n) ,空间复杂度O(n)(n代表模式串的长度,m代表主串的长度)

代码:

#include <iostream>
#include<string>
using namespace std;

//返回模式串的next数组。
void next(string s, int nex[]) {
    int n = s.length();
    for (int i = 0; i < n; i++) {     //顺序计算next值
        nex[i] = 0;
        for (int j = i; j > 0; j--) {      //从i个数开始比较,找到next值
            string s2 = s.substr(0, j);
            string s3 = s.substr(i - j + 1, j);
            if (s2 == s3) { nex[i] = j; break; }
        }
    }
}

//返回模式串在主串中的位置
int KMP(string s, string s1, int nex[]) {
    int result = -1, n = s.length(), n1 = s1.length();
    for (int i = 0, j = 0; i < n; i++) {  //对主串的遍历
        if (s[i] != s1[j]) {     
            if (j == 0) { continue; }   //防止j为0陷入死循环以及防止越界
            j = nex[j - 1];    //前面有nex[j-1]个元素已经成功匹配,无需浪费时间。
            i--;
        }
        else {
            j++;    //该位置元素相同,匹配下一个元素。
        }
        if (j == n1) { result = i - n1 + 1; break; }
    }
    return result;
}

int main()
{
    string s = "ababababababcabc";
    string s1 = "bababca";
    int* nex = new int[s.length()];
    next(s1, nex);
    int k = KMP(s, s1, nex);
    if (k == -1) {
        cout << "未寻找到模式串" << endl;
    }
    else {
        cout << "找到模式串,在主串的第" << k+1 << "个元素所在位置。" << endl;
    }
    delete[] nex;
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值