KMP算法简短实现,背诵必备
KMP算法
一、KMP算法是什么?
KMP算法引入:
KMP是三位大牛:D.E.Knuth、J.H.Morris和V.R.Pratt发现的。
KMP算法要解决的问题就是在字符串(主串)中的模式(pattern)定位问题。
说简单点就是我们平时常说的关键字搜索。模式串就是关键字(接下来称它为P),如果它在一个主串(接下来称为T)中出现,就返回它的具体位置,否则返回-1。
例如:
你要在OrangeTao(主串p)中查找Tao(子串s)是否存在,并且想得知Tao的存在位置。那么此时就可以用到KMP算法。
这就是KMP算法最简单最直接的应用。
时间复杂度变化 O(p_size * s_size) ====>>> O(p_size + s_size)
二、KMP算法过程部分
1.KMP的核心代码部分
1-1核心代码1
// s[]是主串,p[]是子串,s_size是s[]的长度,p_size是p[]的长度
//求子串的nex数组:
//注:nex[i]表示的是子串p中的下标索引为i的元素到下标索引为1的元素(即:p[1]~p[i])中重复的串长(由于p[]从1开始计数,因此重复的串长也是子串前缀重复的最后一个字符的index)
for (int i = 2, j = 0; i <= p_size; i ++ )
{
while (j && p[i] != p[j + 1]) j = nex[j];
if (p[i] == p[j + 1]) j ++ ;
nex[i] = j;
}
注:
nex[i]表示的是子串p中的下标索引为i的元素到下标索引为1的元素(即:p[1]~p[i])中重复的串长(由于p[]从1开始计数,因此重复的串长也是子串前缀重复的最后一个字符的index)
举例说明(next[0]=-1):
1-2核心代码2
// 匹配
for (int i = 1, j = 0; i <= n; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j ++ ;
if (j == m)
{
j = ne[j];
// 匹配成功!!!
}
}
2.读入数据
代码如下(示例):
cin >> p + 1;
cin >> s + 1;
KMP背景介绍
KMP算法[1]是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n) 。
KMP算法是三位学者在 Brute-Force算法的基础上同时提出的模式匹配的改进算法。Brute- Force算法在模式串中有多个字符和主串中的若干个连续字符比较都相等,但最后一个字符比较不相等时,主串的比较位置需要回退。KMP算法在上述情况下,主串位置不需要回退,从而可以大大提高效率 。
总结
提示:本文主要分析了KMP算法的代码理解与运用。
参考资料
[1]百度百科