LeetCode常见经典算法——KMP算法

本文介绍了LeetCode中常见的经典算法——KMP算法,详细解析了算法的关键点,包括有效回溯、最大公共前后缀长度和next数组。通过示例解释了如何推导next数组,以及KMP算法如何避免不必要的回溯操作,提高字符串匹配效率。
摘要由CSDN通过智能技术生成

常见经典算法

KMP算法

参考:https://www.bilibili.com/video/BV1jb411V78H?from=search&seid=6567338116212695926

关键字:有效回溯、最大公共前后缀长度、样本串的next数组(下一步回溯样本串的比较位置)

类库中String类的indexOf();方法采用的KMP算法,常规方法——依次暴力遍历,如果不匹配回溯到母字符串下一位置继续进行比较!

在这里存在一个问题,回溯到下一位置可能导致很多多余比较操作!例如下面示例:

母串:ABABABABACABCAB
样本串:ABABABC
在上述比较中,进行多次多余回溯操作(多次比较无意义)

既然很多次回溯操作无意义,那么现在找到哪些无意义的回溯,即找到合适正确回溯位置(next数组)!!

推导过程
母串:ABABABABACABCAB
样本串:ABABABC
// 这里位置不是按数组0位开始。
第一次比较在第7位发现与母串不同,那么我们肉眼观察下,下一次比较为
ABABABABACABCAB
    ABABABC
这样最为合理(即母串的第7位与样本串的第5位进行比较)。
那么为什么选择该回溯位置??
那么我们简单看下ABABC这个样本串

样本串 ABABABC 假如与未知字符串比较,那么求出当未知字符串第i位匹配不同时,样本串与未知字符串第i位重新比较的位置,即为样本串的next数组。

怎么求出其对应的next数组?

样本串 ABABABC,如果第5个位置与未知字符串不同,那么前4位为 ABAB , (此处可以理解为样本串后移)后移几位合适?后移则是比较前缀和后缀是否相同,其最大公共前后缀的长度几位下一次比较的样本串的位置。

问题转化为求取样本串的当前位置之前的最大公共前后缀的长度(next数组),也是KMP算法的核心部分。

A B A B A B C 的next数组。
0 0 0 1 2 3 4

已知next数组后循环母表逻辑流程图如下:

在这里插入图片描述

indexOf()的示例代码如下:

class Solution {
   

    /**
	 * 寻找最长公共前缀后缀的长度
	 * 示例:ABABCABAB
	 * 前缀集合(不包含示例本身):A, AB, ABA, ABAB, ABABC, ABABCA, ABABCAB, ABABCABA
	 * 后缀集合(不包含示例本身):B, AB, BAB, ABAB, CABAB, BCABAB, ABCABAB, BABCABAB
	 * 最长公共前缀后缀为,ABAB;返回4
	 * @param needle 传入字符串
	 * @return 最长公共前缀后缀的长度
	 */
	public static int publicPrefix(String needle
KMP算法是一种字符串匹配算法,用于在一个文本串S内查找一个模式串P的出现位置。它的时间复杂度为O(n+m),其中n为文本串的长度,m为模式串的长度。 KMP算法的核心思想是利用已知信息来避免不必要的字符比较。具体来说,它维护一个next数组,其中next[i]表示当第i个字符匹配失败时,下一次匹配应该从模式串的第next[i]个字符开始。 我们可以通过一个简单的例子来理解KMP算法的思想。假设文本串为S="ababababca",模式串为P="abababca",我们想要在S中查找P的出现位置。 首先,我们可以将P的每个前缀和后缀进行比较,得到next数组: | i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | | --- | - | - | - | - | - | - | - | - | | P | a | b | a | b | a | b | c | a | | next| 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 | 接下来,我们从S的第一个字符开始匹配P。当S的第七个字符和P的第七个字符匹配失败时,我们可以利用next[6]=4,将P向右移动4个字符,使得P的第五个字符与S的第七个字符对齐。此时,我们可以发现P的前五个字符和S的前五个字符已经匹配成功了。因此,我们可以继续从S的第六个字符开始匹配P。 当S的第十个字符和P的第八个字符匹配失败时,我们可以利用next[7]=1,将P向右移动一个字符,使得P的第一个字符和S的第十个字符对齐。此时,我们可以发现P的前一个字符和S的第十个字符已经匹配成功了。因此,我们可以继续从S的第十一个字符开始匹配P。 最终,我们可以发现P出现在S的第二个位置。 下面是KMP算法的C++代码实现:
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值