数据结构-KMP算法

KMP算法

  KMP算法常用于字符串的模式匹配,KMP算法相对于朴素算法有了很大的改进,避免了没必要的回溯。该算法主要研究模式串,不需要主串的信息。

  next数组:当模式匹配串T失配的时候,next 数组对应元素的指导应该用T串的哪一位进行下一轮的匹配。KMP算法核心就在于构建next数组。

  默认next数组0号位存放的是数组的长度,字符串从1开始。i是后缀,j是前缀。next数组的第一位总是0,可以这样理解:当第一位失配后,T串使用存放数组长度的0号位与主串匹配,此时j=0,i和j都+1,主串和模式串同时使用下一匹配,此时即为T串的第一位。

#include <stdio.h>
typedef char* String;

void get_next( String T , int *next)
{
	int j=0;
	int i=1;
	next[1]=0;

	while(i<T[0])
	{
		if(0==j || T[i]==T[j])
		{
			i++;
			j++;
			//next[i]=j;

			// 算法改进
			if(T[i]!=T[j])
			{
				next[i]=j;
			}
			else
			{
				next[i]=next[j];
			}
			//
		}
		else
		{
			j=next[j];
		}
	}
}
	

int Index_KMP(String S,String T,int pos)
{
	int i=pos;
	int j=1;
	int next[255];

	get_next(T,next);

	while(i<=S[0]&&j<=T[0])
	{
		if(0==j || s[i]==T[j])
		{
			i++;
			j++;
		}
		else
		{
			j=next[j]
		}
	}
	if(j>T[0])   //匹配到最后一位 j++ 所以j会大于T[0]
	{
		return i-T[0];
	}
	else
	{
		return 0;
	}
	
}

  如果当 S串为 aaaabcde,子串T为aaaax时,其子串的next数组为012345,当匹配到子串最后一个a时失配,如果按照next数组指示的顺序匹配,明显可以看出,子串前面三个a仍然会失配,这是KMP算法的一个缺陷。所以做出一步改进:需要加一步判断,如果next数组指导的下一个元素跟之前的元素相同,则应该回溯到最先的元素处。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值