学习KMP (概念 + 模板 + 例题: 子串查找)

我又回来了,感jio这几天有点勤啊!!
这一次我带着KMP来了,在这里插入图片描述
在这里插入图片描述

KMP介绍

KMP,即 Knuth-Morris-Pratt 字符串查找算法,由Donald Knuth、Vaughan Pratt、James H. Morris三人于1977年联合发表,故取这3人的姓氏命名此算法。

KMP的算法流程如下:
假设字符串S现匹配到位置i,模式串P匹配到位置j:
①若j==-1,或S[i]==P[j],则i++,j++,继续后面的匹配
②若j!=-1且S[i]!=P[j],则i不变,j=next[j]
(这样就意味着当每次失配时,模式串P相对于字符串S向右移动了j-next[j]位)
这样就不用每次从头开始跑了

那么我们来看看next数组是怎么计算的。
①寻找模式串P的最长前缀、后缀
假设字符串S为ABCDAB ABCDABCDABDE,模式串P为ABCDABD

字符串前缀后缀最大公共元素长度
A0
ABAB0
ABCA,ABC,BC0
ABCDA,AB,ABCD,CD,BCD0
ABCDAA,AB,ABC,ABCDA,DA,CDA,BCDA1
ABCDAB2
ABCDABD

字符ABCDABD
公共元素长度0000120

ABCDAB ABCDABCDABDE
ABCDABD
这时D和空格匹配,
那么P向右移动的位数=已匹配的字符数(6)-上一个字符的最大公共元素长度(B的时候长度为2)=4
当第一位也不匹配的时候,直接向后移动一位。

模板

void kmp () {
	int len = strlen ( p );
	for ( int i = 1, j = 0;p[i];i ++ ) {
		while ( j && p[j] != p[i] )
			j = nxt[j];
		nxt[i + 1] = p[j] == p[i] ? ++ j : 0;
	}
	int tot = 0;
	for ( int i = 0, j = 0;s[i];i ++ ) {
		while ( j && p[j] != s[i] )
			j = nxt[j];
		if ( p[j] == s[i] && ++ j == len ) {
			tot ++;
			j = nxt[j];
		}
	}
	printf ( "%d", tot );
}

看懂了的话,就来到例题试试吧!
在这里插入图片描述

例题: 子串查找

题目

给出两个字符串s和p,其中p为s的子串,求p在s中的出现次数。
必须完全连续匹配,且s,p全部为大写或小写字母

输入格式
第一行为一个字符串,即为s
第二行为一个字符串,即为p
输出格式
输出一个整数,表示p在s中的出现次数。

输入输出样例
输入
zyzyzyz
zyz
输出
2

N<=1000000

暴力题解

暴力很好想,就是一个一个地跑,一旦遇到不匹配的,就从头开始重新跑:
假设字符串S现匹配到位置i,模式串P匹配到位置j。
那么,当S[i]==P[j]的时候,i++,j++,并继续下一次匹配。
若S[i]!=P[j],则i=i-j+1,j=0,即将i移动到此轮匹配的下一位,j置0重新匹配。

代码就不献给诸君了,因为我懒得写

KMP题解

遇到某些题目,例如给多个匹配串和一个模式串,大家千万不要跑n遍next数组,
没有必要因为,next根本没有变。
在这里插入图片描述
因为这道题是个模板,看懂了KMP介绍的各位小可爱,就不需要再解释为什么了?

我重点分析一下代码这玩意儿:
nxt[i]的含义:在模式串p中,从0到i-1为止前缀后缀字符最大匹配长度。
第一个for循环就是处理出nxt,因为当我们处理到i时,要找到0~i-1的nxt,
怕麻烦,我们可以把nxt整体往后移1,这样i就对应了nxt[i-1]
注意循环里的while (j=nxt[j])不能写成j=0,举个栗子:
abcdefababacdefababxyz
abacdefabab
ans:2,你如果写成0,wrong ans:1
因为写成零的话当你走到模式串p的倒数第二个字符,即a的时候你没有存下1,
导致最后循环到b的时候nxt没有成为2,反而是0,在s中查找的时候就会错过一个答案开头(关注加粗)

第二个循环就是找个数了,前文提到是将整个p右移x-nxt[i],而我则是写成将p的下标变成nxt[i]
控制s不变,这样就是个相对对应关系了,我们反正是用下标操作,不一定要移动两个字符串
好好理解吧~~
while里的j也不能直接赋值成为0,不然你连样例都过不了,还做什么??
具体原因与上面如出一辙,我不再阐释。。。

一句话就是如果写成j=0,那么那些所有模式串结尾等于模式串开头的数据,基本上你都凉了~~
abcdabcda
abcda
这种类似数据你可能都要少算,因为s有两个模式串共用了一个字符,你就GG了

我知道很多小可爱,看完后。。
在这里插入图片描述
也就只有大牛 不有可能,大佬都被我搞蒙了,看来我技术还是不错的~

代码实现

#include <cstdio>
#include <cstring>
#define MAXN 1000005
char s[MAXN], p[MAXN];
int nxt[MAXN];

void kmp () {
	int len = strlen ( p );
	for ( int i = 1, j = 0;p[i];i ++ ) {
		while ( j && p[j] != p[i] )
			j = nxt[j];
		nxt[i + 1] = p[j] == p[i] ? ++ j : 0;
	}
	int tot = 0;
	for ( int i = 0, j = 0;s[i];i ++ ) {
		while ( j && p[j] != s[i] )
			j = nxt[j];
		if ( p[j] == s[i] && ++ j == len ) {
			tot ++;
			j = nxt[j];
		}
	}
	printf ( "%d", tot );
}

int main() {
	scanf ( "%s %s", s, p );
	kmp ();
	return 0;
} 

那个男人,带着KMP走来了,又一脸懵逼地离开了?
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值