P3375 【模板】KMP字符串匹配 KMP 模板

好久没做KMP/AC自动机的题了,都快忘了。  就多校HDU做了一道,还是直接套的板子。

这次准备手敲KMP/AC自动机,弄熟悉一点,做点经典题目。

看了5min的B站KMP视频,手敲了板子一遍过。(现在的算法理解能力比之前快多了)

回顾下KMP的算法吧:

首先暴力的话:

枚举文本串p所有位置(长度m),每个位置用模式串匹配(长度n)。复杂度n*m。

而我们发现:

形如:p:  abababac,  t=ababa时,暴力匹配非常低效

因为我们在匹配p,和t时有很多额外信息被浪费了。

我们记录nxt[i],表示模式串p,下标i位置,后缀子串与前缀子串最大相同的长度(不包括自身)。

比如t=ababa的时候,

nxt[1]=0,nxt[2]=0,nxt[3]=1,nxt[4]=2,nxt[5]=3,

然后让p,t匹配:枚举p的位置i,t的位置j

abacababa

ababa

i=4,j=3时,p[i]!=t[j+1],匹配失败。

暴力匹配的话此时会让i=2,j=0重新匹配。

而我们有了nxt后,让j=nxt[3]=1,i不变,即:

abacababa

   ababa

此时判断p[i]!=t[j+1],继续让j=nxt[1]=0;

abacababa

      ababa

此时p[i]!=t[j+1],仍然不匹配,但此时j已经为0了,所以位置i匹配失败,i++,j依然等于0继续匹配

我们发现i遍历m,而j最多增加n,j=nxt[j] ,的操作每次都是严格递减(我们确保了nxt[i]!=tp)的,所以j最多变化m次,即总复杂度O(n+m)

nxt数组的求法与匹配类似。相当于用模式串p自身进行匹配求nxt,看看代码手动模拟下就懂了

 

 

#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int M = 1e6+7;
struct KMP
{
	char p[M],t[M];//模式串p,文本串t,p在t中出现次数,及位置, 下标1-n 
	int nxt[M],n,m,f[M];//nxt[i]:模式串p下标i位置前缀和后缀最大匹配的长度。(不包括自身)
	//f[i]: 文本串t下标i位置后缀子串与模式串p后缀子串最大匹配的长度。
	void get_nxt()
	{
		nxt[1]=0;
		for(int i=2,j=0;i<=n;i++)
		{
			while(j>0&&p[j+1]!=p[i])j=nxt[j];
			if(p[j+1]==p[i])j++;
			nxt[i]=j;
		}
	}
	void gao() 
	{
		n=strlen(p+1),m=strlen(t+1);
		get_nxt();
		for(int i=1,j=0;i<=m;i++)
		{
			while(j>0&&(p[j+1]!=t[i]||j==n))j=nxt[j];
			if(p[j+1]==t[i])j++;
			f[i]=j;
			//if(f[i]==n)此时完成了一次匹配 
		}
	}
}kmp;

int main()
{
	ios::sync_with_stdio(false);
  	cin.tie(0);
	cin>>(kmp.t+1)>>(kmp.p+1);
	kmp.gao();
	for(int i=1;i<=kmp.m;i++)
		if(kmp.f[i]==kmp.n)cout<<i-kmp.n+1<<"\n";
	for(int i=1;i<=kmp.n;i++)cout<<kmp.nxt[i]<<" ";
	cout<<endl;
	return 0;
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值