kmp算法

一个长度为n的字符串T(文本串),和长度为m的字符串(模板串),在字符串T中寻找字符串匹配点,朴素的算法就是二重循环暴力寻找,这样的时间复杂度为O(n*m),而现在要介绍的kmp算法时间复杂度O(n+m),这个时间复杂度已经达到理论的上界了,因为至少所有的字符都需要遍历

kmp算法是利用模板串自身的特性判断出失配后该走向哪

比如字符串abbaaba在匹配到最后一个的时候发现不匹配了,这个时候前面6个文本字符的信息abbaab的信息就可以加以利用前缀ab和后缀ab相同,所以移动至少要移动4位,而为了记录每次失配后应该怎么走需要在引进一个数组f

void getfail(char *p,int *f)
{
	int m=strlen(p);
	f[0]=0;
	f[1]=0;
	for(int i=1;i<m;i++)
	{
		int j=f[i];
		while(j&&p[i]!=p[j]) j=f[j];//利用前面的信息进行递推 
		f[i+1]=p[i]==p[j]?j+1:0;//若p[i]==p[j],则失配时到j+1再比较,此时已经保证前j个已经匹配 
	}
}
void find(char *T,char *P,int *f)
{
	int n=strlen(T),m=strlen(P);
	getfail(P,f);//计算f数组 
	int j=0;
	for(int i=0;i<n;i++)
	{
		while(j&&T[i]!=p[j]) j=f[j];//顺着失配边走 
		if(T[i]==p[j]) j++;//模板串后移 
		if(j==m) printf("%d\n",i-m+1);
	}
} 

 例:

主串:abacbcabababbcbc

模式串:abababb

j0123456
模式串abababb
next[j]-1001234

对于next函数的理解,可以找一个例子自己算一算,相信会有更加深刻的认识

 

next数组的本质是模式串中下标X之前的最长等值前后缀的长度

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值