KMP算法失配处理

最新推荐文章于 2024-03-24 17:41:45 发布

ZYT＿庄彦涛

最新推荐文章于 2024-03-24 17:41:45 发布

阅读量1.5k

点赞数 17

分类专栏：算法数据结构文章标签：算法数据结构

本文链接：https://blog.csdn.net/weixin_45528773/article/details/136135984

版权

数据结构同时被 2 个专栏收录

11 篇文章

订阅专栏

算法

10 篇文章

订阅专栏

当使用KMP算法匹配字符串s=abaabaabacacaabaabcc与模式串T=abaabc时，首次失配发生在i=5，j=5。根据KMP算法原理，j会回退到next函数确定的值，即子串t=abaab的最长前后缀长度，j=2。因此，下次匹配的i=5，j=2。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

已知字符串s为“abaabaabacacaabaabcc”，模式串T为“abaabc”。采用KMP算法进行匹配，第一次出现“失配”(s[i]≠t[j])时，i=j=5，则下次开始匹配时i和j的值分别是( )

A.i=1，j=0

B.i=5，j=0

C.i=5，j=2

D.i=6，j=2

解这道题前，首先要了解什么是KMP算法?

KMP算法是三位学者提出来的，全称是克努特D.E.Knuth—莫里斯J.H.Morris—普拉特V.R.Pratt操作，是一种根据BF算法改进的字符串的模式匹配算法。
模式匹配就是在主串中寻找一个给定的模式，返回主串和模式串匹配的第一个子串的首字符位置。通常主串比较大，而模式串则比较短小。
所以如果要了解什么是KMP算法，需要先了解什么是BF算法。
BF算法(Brute Force算法)
也就是我们经常说的暴力算法。
基本思想：
就是将主串S的第一个字符与模式串T的第一个字符字符字符进行匹配，
若相等，则继续比较S的第二个字符和T的第二个字符；
若不相等，则比较S的第二个字符和T的第一个字符；
依次比较下去，直到得出最后的匹配结果。
【换句话就是在模式串中有多个字符和主串中的若干个连续字符比较都相等，但最后一个字符比较不相等时，主串的比较位置需要回退】
而KMP算法在上述情况下，通过一个本身包含了模式串的局部匹配信息的next()函数，利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的，即主串位置不需要回退【或者理解为求得模式的特征向量之后，在每次匹配过程中发生某次失配时，不再单纯地把模式后移一位，而是根据当前字符的特征数来决定模式右移的位数（右移的距离是由模式串T本身决定的，即T的子串t[0...j-1]中的前缀串和后缀串相等的最长长度）】，这样就可以大大提高效率，这就是KMP算法。