KMP字符串匹配算法（深度代码理解）（简短几行代码解决KMP，背诵必备）

OrangeTaoer

已于 2022-03-20 16:27:46 修改

阅读量394

点赞数 2

分类专栏：算法学习专栏文章标签： c++ 算法

于 2022-03-20 16:20:19 首次发布

本文链接：https://blog.csdn.net/internrno/article/details/123613219

版权

算法学习专栏专栏收录该内容

3 篇文章 0 订阅

订阅专栏

KMP算法简短实现，背诵必备

KMP算法
一、KMP算法是什么？
- KMP算法引入：
二、KMP算法过程部分
KMP背景介绍
总结
参考资料

KMP算法

一、KMP算法是什么？

KMP算法引入：

KMP是三位大牛：D.E.Knuth、J.H.Morris和V.R.Pratt发现的。

KMP算法要解决的问题就是在字符串（主串）中的模式（pattern）定位问题。
说简单点就是我们平时常说的关键字搜索。模式串就是关键字（接下来称它为P），如果它在一个主串（接下来称为T）中出现，就返回它的具体位置，否则返回-1。
例如：
你要在OrangeTao(主串p)中查找Tao(子串s)是否存在，并且想得知Tao的存在位置。那么此时就可以用到KMP算法。

这就是KMP算法最简单最直接的应用。

时间复杂度变化 O(p_size * s_size) ====>>> O(p_size + s_size)

二、KMP算法过程部分

1.KMP的核心代码部分

1-1核心代码1

// s[]是主串，p[]是子串，s_size是s[]的长度，p_size是p[]的长度

//求子串的nex数组：
//注：nex[i]表示的是子串p中的下标索引为i的元素到下标索引为1的元素(即:p[1]~p[i])中重复的串长(由于p[]从1开始计数，因此重复的串长也是子串前缀重复的最后一个字符的index)
for (int i = 2, j = 0; i <= p_size; i ++ )
{
    while (j && p[i] != p[j + 1]) j = nex[j];
    if (p[i] == p[j + 1]) j ++ ;
    nex[i] = j;
}

注：
nex[i]表示的是子串p中的下标索引为i的元素到下标索引为1的元素(即:p[1]~p[i])中重复的串长(由于p[]从1开始计数，因此重复的串长也是子串前缀重复的最后一个字符的index)

举例说明（next[0]=-1）：
在这里插入图片描述

1-2核心代码2

// 匹配
for (int i = 1, j = 0; i <= n; i ++ )
{
    while (j && s[i] != p[j + 1]) j = ne[j];
    if (s[i] == p[j + 1]) j ++ ;
    if (j == m)
    {
        j = ne[j];
       // 匹配成功！！！
    }
}

2.读入数据

代码如下（示例）：

cin >> p + 1;
cin >> s + 1;

KMP背景介绍

KMP算法[1]是一种改进的字符串匹配算法，由D.E.Knuth，J.H.Morris和V.R.Pratt提出的，因此人们称它为克努特—莫里斯—普拉特操作（简称KMP算法）。KMP算法的核心是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现，函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n) 。

KMP算法是三位学者在 Brute-Force算法的基础上同时提出的模式匹配的改进算法。Brute- Force算法在模式串中有多个字符和主串中的若干个连续字符比较都相等,但最后一个字符比较不相等时,主串的比较位置需要回退。KMP算法在上述情况下,主串位置不需要回退,从而可以大大提高效率。