KMP算法

 

看了牛客网进阶学习中的KMP算法,觉得讲的还不错,加深了自己的理解(上学期郑老师讲完基本就忘了)。

目录

kmp要求的问题

next数组的用处

匹配的方法

next数组的求法

最后附上总的代码


 

  • kmp要求的问题

       从第一个字符串中找到第二个字符串第一次出现的位置,如果没有输出-1。


  • next数组的用处

      记录最长的公共的前缀和后缀。

      举个例子,abcab,next数组存储的值为2;aaaa,next数组值为3,因为不允许覆盖全部;abc,值就为0了。


  • 匹配的方法

       由于next数组已经求出了公共的前后缀的长度,如果一个匹配不能完成,那么就直接用str2去匹配str1所对应的后缀部分。如下图所示,就是这么跳跃的。

而用代码描述就是这样的(我自己写的,可能存在问题):

i和j分别是指向str1和str2的指针,用指针的移动表示字符串开头的移动。

int kmp()
{
	get_next();
	int i = 0;
	int j = 0;
	while(i<s1.length()&&j<s2.length())
	{
		if(s1[i]==s2[j]) //如果两个相等,一起向后 
			i++,j++;
		else if(nxt[j]==-1) //如果不相等,并且nxt数组=-1了,说明没有公共段了,只能i++ 
			i++;
		else 
			j = nxt[j]; //否则直接跳过公共段,从第一个不相同的位置开始匹配 
	}
	return j==s2.length()?i-j:-1;
}

  • next数组的求法

      next数组是根据数学归纳法求出来的,默认nxt[0]=-1,nxt[1]=0,然后从2开始,如果当前字符-1和上一个字符的公共前缀的后一个字符(记为k)相等,那么结果+1;否则的话要分情况处理,如果nxt[k]!=0的话,那么就让i和字符k的公共前缀的后一个字符去匹配。

      用语言讲太抽象了,还是放张示意图。

这对应的是第一种情况,对于字符d,由于它的前一个字符c和对于c来说的前缀ab的后一个字符c相等,所有nxt数组 = nxt[i-1]+1;

对于第二种情况,就需要如图所示依次匹配,直到next数组结果为-1,即匹配到第一个字符了。

具体的代码实现:

void get_next()
{
	nxt[0] = -1;
	nxt[1] = 0;
	int i = 2;
	int cn = 0; //cn表示当前的最长公共前后缀 
	while(i<s2.length())
	{
		if(s2[i-1]==s2[cn]) //如果i-1和对应的相等,结果+1 
			nxt[i++] = ++cn;
		else if(cn>0) //否则就找cn是否和i-1相等 
			cn = nxt[cn];
		else {
			nxt[i++] = 0;
		}
	}	
}

  • 最后附上总的代码

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cmath>
#include <algorithm>
#include <vector>
#include <map>
#include <set>
#include <queue>
using namespace std;

#define INIT(x) memset(x,0,sizeof(x))
#define eps 1e-8

typedef long long ll;
const int inf = 0x3f3f3f3f;
const int maxn = 200005;

string s1,s2;
int nxt[maxn];

void get_next()
{
	nxt[0] = -1;
	nxt[1] = 0;
	int i = 2;
	int cn = 0; //cn表示当前的最长公共前后缀 
	while(i<s2.length())
	{
		if(s2[i-1]==s2[cn]) //如果i-1和对应的相等,结果+1 
			nxt[i++] = ++cn;
		else if(cn>0) //否则就看cn是否大于0,能回溯就回溯
			cn = nxt[cn];
		else {
			nxt[i++] = 0;
		}
	}	
}

int kmp()
{
	get_next();
	int i = 0;
	int j = 0;
	while(i<s1.length()&&j<s2.length())
	{
		if(s1[i]==s2[j]) //如果两个相等,一起向后 
			i++,j++;
		else if(nxt[j]==-1) //如果不相等,并且nxt数组=-1了,说明没有公共段了,只能i++ ,这里不可以改成nxt[j]<=0,否则j不能回到s2的开头位置
			i++;
		else 
			j = nxt[j]; //否则直接跳过公共段,从第一个不相同的位置开始匹配 
	}
	return j==s2.length()?i-j:-1; //i位正好匹配到末尾,减去j就是开头
}

int main()
{
	cin>>s1>>s2;
	int ans = kmp();
	cout<<ans<<endl;
	return 0;
}


 

1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。、可私 6信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 、可私信6博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 、可私信6博主看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

总想玩世不恭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值