4-7 kmp算法

本文详细介绍了Knuth-Morris-Pratt(KMP)算法的基本原理及其两种实现方式:使用next数组和nextval数组的方法。通过具体代码示例展示了如何在字符串搜索中应用KMP算法,并对比了两种实现方式的不同。
摘要由CSDN通过智能技术生成

串的模式匹配2--Knuth-Morris-Pratt算法(kmp算法)

算法描述:

(1)     关于next数组的实现算法:

void GetNext(String s,int next[ ])

{

         int j,k;

         j=0;k=-1;

         next[0]=-1;

         while(每个字符的前的串中进行遍历)

         {

                if(当k下标回到t串首字符前或是t,data[k]==t.data[j]连续成立)

                {j++;k++;next[j]=k;}

                else{k=next[k];回退}

}

    

}

(2)     改进后,关于nextval数组的实现算法:

voidGetNextval(SqString t,int nextval[])  //由模式串t求出nextval值

{

  int j=0,k=-1;

  nextval[0]=-1;

       while(j<t.length与原先相比遍历长度加1)

  {

           if(k==-1 || t.data[j]==t.data[k])

         {     

                j++;k++;

                if (t.data[j]!=t.data[k] 共同前进一位后比较不相同)

                       nextval[j]=k;

               else 

                       nextval[j]=nextval[k];把前一个nextval值赋给next[j]

           }

           else  k=nextval[k];          

  }

}


kmp(未改进)完整代码:

//KMP算法
#include "sqstring.cpp"
void GetNext(SqString t,int next[])		//由模式串t求出next值
{
	int j,k;
	j=0;k=-1;next[0]=-1;
	while (j<t.length-1) 
	{	
		if (k==-1 || t.data[j]==t.data[k]) 	//k为-1或比较的字符相等时
		{	
			j++;k++;
			next[j]=k;
			printf("(1) j=%d,k=%d,next[%d]=%d\n",j,k,j,k);
       	}
       	else
		{
			k=next[k];
			printf("(2) k=%d\n",k);
		}
	}
}
int KMPIndex(SqString s,SqString t)  //KMP算法
{
	int next[MaxSize],i=0,j=0;
	GetNext(t,next);
	while (i<s.length && j<t.length) 
	{
		if (j==-1 || s.data[i]==t.data[j]) 
		{
			i++;j++;  			//i,j各增1
		}
		else j=next[j]; 		//i不变,j后退
    }
    if (j>=t.length)
		return(i-t.length);  	//返回匹配模式串的首字符下标
    else  
		return(-1);        		//返回不匹配标志
}
int main()
{
	SqString s,t;
	StrAssign(s,"ababcabcacbab");
	StrAssign(t,"abcac");
	printf("s:");DispStr(s);
	printf("t:");DispStr(t);
	printf("位置:%d\n",KMPIndex(s,t));
	return 1;
	
}

kmp1(改进后)完整代码:



//改进的KMP算法
#include "sqstring.cpp"
void GetNextval(SqString t,int nextval[])  //由模式串t求出nextval值
{
	int j=0,k=-1;
	nextval[0]=-1;
   	while (j<t.length) 
	{
       	if (k==-1 || t.data[j]==t.data[k]) 
		{	
			j++;k++;
			if (t.data[j]!=t.data[k]) 
				nextval[j]=k;
           	else  
				nextval[j]=nextval[k];
       	}
       	else  k=nextval[k];    	
	}

}
int KMPIndex1(SqString s,SqString t)    //修正的KMP算法
{
	int nextval[MaxSize],i=0,j=0;
	GetNextval(t,nextval);
	while (i<s.length && j<t.length) 
	{
		if (j==-1 || s.data[i]==t.data[j]) 
		{	
			i++;j++;	
		}
		else j=nextval[j];
	}
	if (j>=t.length)  
		return(i-t.length);
	else
		return(-1);
}
int main()
{
	SqString s,t;
	StrAssign(s,"ababcabcacbab");
	StrAssign(t,"abcac");
	printf("s:");DispStr(s);
	printf("t:");DispStr(t);
	printf("位置:%d\n",KMPIndex1(s,t));
	return 1;
}

### PTA 平台上的 KMP 算法问题解析 #### 什么是KMP算法KMP算法的核心思想是在模式目标不匹配的情况下,通过预先处理模式来获取一个`next`数组。此数组记录了部分匹配的信息,使得当遇到失配情况时可以快速跳转到下一个可能的匹配位置而不必回溯目标指针,从而提高效率[^1]。 #### 如何实现KMP算法中的Next数组构建? 为了计算给定模式T的`next`数组,在PTA平台上通常会定义如下形式的方法: ```c++ void get_nextval(char T[], int next[]); ``` 这里,T代表待求解的模式,next则是用来存储对应于每一个字符的最大相等前后缀长度减一的结果集。具体来说就是对于任意i(0<i<T.length()),如果存在j满足条件S[0...j-1]=S[i-j...i-1],那么我们就说第i位之前的子具有长度为j的最大相同前缀后缀;此时应设置next[i]=j-1。否则设next[i]=-1表示无这样的重复序列[^2]。 #### 实现完整的KMP搜索功能 同样地,在PTA上也会提供这样一个用于执行实际字符匹配过程的功能接口: ```c++ int Index_KMP(char S[], char T[], int pos, int next[]); ``` 其中参数说明:S为目标字符;T为模板字符;pos指示从哪个索引处开始尝试寻找第一个出现的位置;而最后一个参数next[]即为我们之前提到过的那个辅助性的跳跃表。返回值是一个整数型变量,它代表着所找到的第一个完全吻合项起始地址相对于整个源文本开头偏移量加1后的数值(-1意味着未发现任何符合条件的对象)。 下面给出一段基于上述两个函数完成简单版本KMP查找逻辑的C++示范代码片段: ```cpp #include <iostream> using namespace std; // 计算并填充next数组 void get_nextval(const string& pattern, vector<int>& next){ int j = -1; next[0] = j; for(int i=1;i<pattern.size();){ if(j==-1 || pattern[j]==pattern[i-1]){ ++j;++i; if(pattern[j]!=pattern[i-1]) next[i-1]=j; else next[i-1]=next[j]; } else{ j=next[j]; } } } // 使用KMP算法进行字符匹配 int index_kmp(const string& text,const string& pattern,vector<int> &next,int start_pos=0){ int m=text.size(),n=pattern.size(); int i=start_pos,j=0; while(i<m && j<n){ if(j==-1||text[i]==pattern[j]){ i++;j++; } else{ j=next[j]; } } if(j>=n) return (i-n); else return (-1); } ``` 这段程序首先调用了`get_nextval()`方法初始化好了一个针对特定模式优化好的转移规则列表——也就是所谓的“next”数组之后再借助后者实现了高效的线性时间复杂度内的精确检索操作 `index_kmp()`.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值