KMP算法理解-为什么要找前后缀?

KMP算法的作用是高效匹配字符串。  

当我们要在A字符串中查找出现B字符串的位置时,首先想到的可能是暴力匹配(朴素字符串匹配),使用两层循环:

//暴力匹配法
public class strStr {
	public static void main(String[] args) {
		String A="ABBABBABABAAABABAAA";
		String B="ABBABAABABAA";
		int result=-1;
		for(int i=0;i<A.length();i++){
		    int j=0;
		    for(j=0;j<B.length();j++){
		    	if(i+j>=A.length()) {break;}
		        if((A.charAt(i+j)!=B.charAt(j))){
		            break;
		        }
		    }
		    if(j==B.length()){
		    	result=i;
		    	break;
		    }
		}
		System.out.println(result);
	}
}

这种方法的不足之处是,得逐个循环A中的字符进行对比,而且当B的前端有很多字符匹配成功,后面有字符匹配失败时,下个循环还是要逐个匹配所有字符。

a="ABBABBABABAAABABAAA"

b="ABBABAABABAA"

这种方法的时间复杂度很大。

 

KMP算法利用了B串本身的特征,大致步骤是找到B串每个子串(除了本身)的最长公共前后缀,当B串的第n个字符与A的第m个字符不匹配时,则用B串的第i+1个字符与A的第m个字符开始匹配,其中i的大小为子串B(n-1)对应的最长公共前后缀的长度。

具体讲解可以看:https://www.bilibili.com/video/av49930100?from=search&seid=6540719253469972045

这里就不累述,但是有几点思考:

1. KMP算法的根本原理是什么?

KMP算法利用了B串本身的特征,当B串的第n位匹配不上时,接下来,就要寻找能与n位前面的i个字符匹配上的,也就是之前找到的B串的前i位,将B串的前i位与A串n位置的前i位对齐是一定匹配的,所以只需要从第i+1的位置继续匹配。

2. 为什么找的是公共前后缀,中间有部分和后面相同,可以将中间的几位移到后面位置吗?

可以验证一下这个方法,比如

A串为ABXXABYYABB...

B串为ABXXABYYABA...

其中XX/YY表示任意长度的任意字符,现在可以看到最后一位不匹配,而且B串最长公共前后缀是AB,但是中间还有一个AB,如果此时将中间的那个AB移到后面开始比较:

	ABXXABYYABB...
	    ABXXABYYABA...

对齐的话是这种效果,想开始比较最后一位B与Y,那么就是有把握B串的Y前面的ABXXAB与A串的ABYYAB相同,也就是XX要与YY相同。那么B串的最长公共前后缀就不是AB,而是ABXXAB,这与B串的最长公共前后缀是AB冲突,所以不行。

 

 

极端情况下,B串的所有最长公共前后缀长度都为0,那么时间复杂度就和暴力穷举法相同,为m*n

KMP代码://download.csdn.net/download/Michaelia_hu/12005131

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 5
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
BF算法KMP算法都是串的模式匹配算法,但是它们的时间复杂度不同。BF算法的时间复杂度为O(m*n),其中m和n分别为主串和模式串的长度。而KMP算法的时间复杂度为O(m+n)。因此,当模式串较长时,KMP算法的效率更高。 下面是BF算法KMP算法的介绍和演示: 1. BF算法(暴力匹配算法) BF算法是一种朴素的模式匹配算法,它的思想是从主串的第一个字符开始,依次和模式串的每个字符进行比较,如果匹配成功,则继续比较下一个字符,否则从主串的下一个字符开始重新匹配。BF算法的时间复杂度为O(m*n)。 下面是BF算法的Python代码演示: ```python def BF(main_str, pattern_str): m = len(main_str) n = len(pattern_str) for i in range(m-n+1): j = 0 while j < n and main_str[i+j] == pattern_str[j]: j += 1 if j == n: return i return -1 # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(BF(main_str, pattern_str)) # 输出:6 ``` 2. KMP算法(Knuth-Morris-Pratt算法KMP算法是一种改进的模式匹配算法,它的核心思想是利用已经匹配过的信息,尽量减少模式串与主串的匹配次数。具体来说,KMP算法通过预处理模式串,得到一个next数组,用于指导匹配过程中的跳转。KMP算法的时间复杂度为O(m+n)。 下面是KMP算法的Python代码演示: ```python def KMP(main_str, pattern_str): m = len(main_str) n = len(pattern_str) next = getNext(pattern_str) i = 0 j = 0 while i < m and j < n: if j == -1 or main_str[i] == pattern_str[j]: i += 1 j += 1 else: j = next[j] if j == n: return i - j else: return -1 def getNext(pattern_str): n = len(pattern_str) next = [-1] * n i = 0 j = -1 while i < n-1: if j == -1 or pattern_str[i] == pattern_str[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(KMP(main_str, pattern_str)) # 输出:6 ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值