KMP算法

背景引入

在某些时候,我们常常会出现字符串匹配的问题。
例如:对于字符串s1,s2,判断s2在s1中出现的次数,正常来说,如果暴力枚举的话,我们需要使用O(n*m)的时间复杂度。
有三位大佬就想出了KMP算法,保证了O(n+m)线性复杂度。

算法讲解

基本思想

KMP算法的基本思想就是,当我们在字符串匹配的时候,如果出现了不匹配的情况,我们并不需要重新枚举,而是通过next数组(之后再说如何生成的),从某个特定的位置开始匹配。而如何知道这个特定的位置,便是next数组。

我们先看一组样例:

主串:  ABABABCAA
模拟串:ABABC

当我们正常匹配时,会出现匹配到C时出现问题,那么正常来说,我们需要回退主串到B然后继续匹配:

回退 然后重新匹配
主串:  ABABABCAA
模拟串: ABABC

但这样是很麻烦的,通过观察,我们可以这样移动模拟串:

通过观察的移动,且前面两个AB并不需要匹配
只需要匹配后面的三个数即可
主串:  ABABABCAA
模拟串:  ABABA

我们发现,如果回退,然后重新匹配会浪费很多时间,但我们可以通过next数组来达到最优的移动,且重复的匹配并不需要。
这就是next数组,next数组存储的当出现字符串不匹配的时候,我们该如何移动。
这个便是已经知道了next数组以后,程序的实现:

//i代表s1的起点 j代表s2的第几个位置
	for(int i=1,j=0; i<=n; i++) {
   
		//如果匹配失败 通过next数组j不断往回退 直到可以继续匹配
		while(j && s1[i]!=s2[j+1]) j = next[j];
		//匹配成功 j++
		if(s1[i] == s2[j+1]) j++;
		//当j到达字串的末尾,匹配成功
		if(j == m) {
   
			//通过next数组移动
			j=next[j];
			cout<<i-m+1<<'\n';
		}
	}

如何生成next数组

那么我们既然已经知道了next数组的作用了,那么该如何生成next数组呢?
继续看例子:

主串:  ABABABCAA
模拟串:ABABC

我们会发现,我们之所以会移动两个字符,是因为移动的AB和ABABC中加粗的字符是一样的,对于字串的前四个字符,它们拥有一个相同的前缀和后缀AB,所以我们才能移动两个字符。

next数组的本质就是相同前后缀的最长长度

继续看例子:

模拟串:	 ABABC
next:	 00120

如何通过代码实现next数组,我们可以使用暴力枚举的方式,但这样时间复杂度很高,我们可以通过递推的方式来实现:

//求next数组
	// 从2开始  因为ne[0]=0,ne[1]=0;
	for(int i=2,j=0; i<=m; i++) {
   
		//如果出现不匹配的情况或者j为0就是出现意外了
		while(j && s2[i]!=s2[j+1])
			j = ne[j];
		if(s2[i] == s2[j+1])
			j++;
		ne[i] = j;
	}

递归的本质就是通过已知的数据来推出后面的数据。

例子

题目链接

【模板】KMP

题目描述

给出两个字符串 s 1 s_1 s1 s 2 s_2 s2,若 s 1 s_1 s1 的区间 [

  • 30
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值