KMP算法

KMP算法简介: 

是一种改进后的字符串的匹配的方法,是尽可能利用子串(模式串)在主串匹配失败后的信息,减少子串(模式串)与主串匹配的次数,以达到节省时间的目的。具体的实现主要是next() ,也就是求解模式串的next数组,函数本身包含了模式串的局部匹配信息。

例如:

             

如图所示,给出一个模式串,求解其 next数组 。模式串中每个字符都有其对应的next 数组元素 ,而每个元素所代表的含义即为  若当前位置匹配失效,则应该模式串下标应该回退的位置(如下图  图二模式串所移动的位置即就是图一中模式串下标2应该回退的位置----->next数组中下标3所对应的元素0) 也就是说 若主串当前位置匹配失效后  那么模式串就会把当前位置所对应的next数组的元素作为参考值 ,并找到模式串中与之对应的下标元素移动到当前的主串位置  进行重新匹配

而图中的 nextval 数组 ,同样的 与next 数组是同一个功能  (找到与主串当前位置匹配失效模式串所要回退的位置)  但nextval 是next 的优化版本   ,nextval 数组在模式串中字符重复度高的情况下使用 更有效。

KMP中 next 数组的求解方法:

一般情况下,定义next数组的0号下标 ,即  next [0] = -1,

由上图分析可得,要求当前位置的next 数组元素 即就是求当前位置红线之前的顺序对称字符的个数。

KMP中 nextval 数组的求解方法:

KMP的算法思想:

在普通的字符匹配过程中 ,就是主串从第一个字符开始,模式串同样从第一个字符开始,逐个依次往后比较,若在某位置匹配失败,主串就回退到本次开始比较的字符串第一个字符的下一个位置,而模式串直接回退到第一个字符的位置,重新进行比较,直到主串到 ' \0 '(匹配失败),或者子串到 ' \0 '(匹配成功)

而KMP算法是主串从第一个字符位置开始进行比较,模式串同样也从第一个字符开始。但不同的是在主串的某个位置匹配失败后,主串无需回退,只需根据当前模式串失配位置对应的所求得的next 数组(或者nextval 数组)的值,移动模式串,从而使得以这个 next数组值为下标的模式串的元素 与 主串失配位置对应  ,然后主串和模式串都以当前失配位置为起点  逐个依次往后匹配, 直到主串到 ' \0 '(匹配失败),或者子串到 ' \0 '(匹配成功)。

在写next 数组代码时所遇到情况

1.第一个位置(也就是next[0]的位置  )统一为 -1

2.若当前位置前面的next数组顺序对称的字符的个数是逐个增加的,那么当前位置next 数组的值就有两种值, 一是前一个                 next 数组值加1,二是直接为0  。

KMP 算法的代码:

#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include<vld.h>
int* GetNext(char *src,int len)                    //1.找到主串当中  最大长度的子串  和 子串当中最大长度的子串  相同
{		
    int *arr=(int *)malloc(len*sizeof(int));      //next数组  保存匹配失败后  需要回退的位置
	arr[0]=-1;                                   //0号下标前面没有元素  所以下次j应该回退到-1号下标  又因为没有-1号下标  所以i++  j的值仍是j=0
	arr[1]=0;                                   //1号下标之前有0号下标  所以下次j应该回退到0号下标
	int left=0;                                 //left即为模式串前缀匹配左边开始的位置  
	for(int i=2;i<len;i++)                      //i表示模式串src数组的下标
	{
		int right=i-1;                         //表示当前i位置的前一位下标     (即为模式串匹配前缀匹配右边结尾的位置)
		if(arr[i-1]==0 && src[0]==src[right])   //如果当前i的位置的前一位的next数组的值为0  并且src中的src[0]==src[right]  
		{
			arr[i]=1;                        //那么当前位置的next数组的值为1
			left++;                         //保留一下left的值  以便于下次计算next时的前缀匹配
		}
		else if(arr[i-1]!=0 && src[left]==src[right])//如果当前位置的前一位next数组的值为非0(即就是大于0的数)且src[left]==src[right] (left即就是上次保留的left的值)
		{
			arr[i]=arr[i-1]+1;                        //当前next的值就是在前一位next数组元素的基础上+1
			left++;                                  //同样的  因为再一次匹配成功  所以left++
		}
		else
		{
			arr[i]=0; //包含两种情况:1.当前位置的前一位next数组值为0 但是src[0]!=src[right]   2.当前位置的前一位next数组值为非0 但是src[left]!=src[right]&&src[0]!=src[right]
			left=0;
		}
	}
	return arr;
}

void Show(int*arr,int len)
{
	for(int i=0;i<len;i++)
	{
		printf("%d ",arr[i]);
	}
	printf("\n");
}
bool KMP(char *dest,char*src,int d_len,int s_len)
{
	int i,j;
	int *p=GetNext(src,s_len);
	for(i=0,j=0 ;i<d_len  && j<s_len;  )
	{
		if(dest[i]==src[j])
		{
			i++;
			j++;
		}
		else
		{
			if(i==0 || p[j]==-1)
			{
				i++;
				j=0;
			}
			else
			{
			    j=p[j];
			}
		}
	}
	free(p);
	p=NULL;
	if(j==s_len)
	{
		return true;
	}
	else
	{
		return false;
	}
	
}



int main()
{
	char* dest="abcabdabcabcd";
	char *src="abcabc";
	int s_len=strlen(src);
	int d_len=strlen(dest);
	//int *get=GetNext(p,s_len);
	//Show(get,s_len);
	//free(get);
	//get=NULL;
	bool a=KMP(dest,src,d_len,s_len);
	if(a==true)
	{
		printf("匹配成功!\n");
	}
	else
	{
		printf("匹配失败!\n");
	}
	return 0;
}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值