KMP字符串模式匹配

1. 算法思想

  KMP算法的核心思想是利用已经得到的部分匹配信息来进行后面的匹配过程

2. 实例如下所示:

下标01234567891011
Sababaaababaa
next[]-100123112345

S串长度为0时,next[0] = -1。

S串长度为1时,next[1] = 0。

S串长度为2时,S串为"ab",next[2] = 0。

S串长度为3时,S串为"aba",next[3] = 1。

S串长度为4时,S串为"ab ab",next[3] = 2。

S串长度为5时,S串为"ababa",next[3] = 3。

……

3. 完整代码

#include <iostream>
using namespace std;

#define maxSize 20
typedef struct//定义字符串结构体
{
	char *ch;
	int length;
}Str;

int strassign(Str& str,char* ch);//字符串赋值操作
void getnext(Str substr,int next[]);//得到子字符串的next[]
int kmp(Str str,Str substr,int next[]);//KMP算法

void main()
{
	Str str,substr;
	str.ch = (char*)malloc(sizeof(char));//结构体初始化,指针要分配空间
	str.length = 0;
	substr.ch = (char*)malloc(sizeof(char));
	substr.length = 0;
	strassign(str,"ababcabcacbab");//赋值
	strassign(substr,"abcac");
	int next[maxSize];
	getnext(substr,next);
	int k = kmp(str,substr,next);
	cout<<"在位置"<<k<<"处匹配"<<endl;
}

//赋值操作
int strassign(Str& str,char* ch)
{
	if(str.ch)
		free(str.ch);
	int len = 0;
	char *c = ch;
	while(*c)//计算字符串长度
	{
		++len;
		++c;
	}
	if(len==0)
	{
		str.ch = NULL;
		str.length = 0;
		return true;
	}
	else
	{
		str.ch = (char*)malloc(sizeof(char)*(len+1));//为了多分配一个空间存放“\0”字符
		if(str.ch==NULL)
		{
			return false;
		}
		else
		{
			c = ch;//赋值操作
			for(int i=0;i<=len;++i,++c)
				str.ch[i] = *c;
			str.length = len;
			return true;
		}
	}
}
//KMP算法
int kmp(Str str,Str substr,int next[])
{
	int i=0,j=0;
	while(i<str.length&&j<substr.length)//主串或子串之一遍历完则结束
	{
		if(str.ch[i]==substr.ch[j])
		{
			++i;
			++j;
		}
		else
		{
			j = next[j];
			if(j==-1)
			{
				j = 0;
				++i;
			}
		}
	}
	if(j==substr.length)
		return i-substr.length;
	else 
		return -1;
}
//求next数组算法如下
void getnext(Str substr,int next[])
{
	int i = 0,j = -1;
	next[0] = -1;
	while(i<substr.length)
	{
		if(j==-1||substr.ch[i]==substr.ch[j])
		{
			++i;
			++j;
			next[i] = j;
		}
		else
			j = next[j];
	}
}

4.C++中使用结构体编程时注意的以下几点:

①方法中的结构体赋值多使用引用或指针。
<pre name="code" class="cpp">int strassign(Str& str,char* ch);

 

结构体使用应先初始化,即分配空间。

<pre name="code" class="cpp">Str str;
str.ch = (char*)malloc(sizeof(char));//结构体初始化,指针要分配空间
str.length = 0;
str.ch = (char*)malloc(sizeof(char)*(len+1));//为了多分配一个空间存放“\0”字符

 

③字符型指针与数组相同,即char *c与char c[]同。

typedef struct//定义字符串结构体
{
	char *ch;
	int length;
}Str;

for(int i=0;i<=len;++i,++c)  str.ch[i] = *c;

char[] s = {'a','x','b','d','e','b','p','q','a','w','u','v','a'}; 


 
 

 



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 简单字符串模式匹配算法:也称为朴素字符串匹配算法,是一种基础的字符串匹配算法。它的思想是从主串的第一个字符开始,依次比较主串和模式串中对应位置的字符是否相等,如果相等则继续比较,直到模式串中所有字符都匹配成功,或者有一个字符不匹配为止。如果不匹配,则将主串的起始位置向后移动一位,重新开始匹配。该算法的时间复杂度为O(m*n),其中m和n分别为主串和模式串的长度。 2. 首位字符串模式匹配算法:也称为BF算法(Brute Force),是一种改进的字符串匹配算法。它的思想是在简单字符串模式匹配算法的基础上,当发现主串中某个字符与模式串中的某个字符不匹配时,不是将主串的起始位置向后移动一位,而是将模式串的起始位置向前移动到上一次比较成功的位置之后的下一位,继续匹配。这样可以减少比较次数,提高匹配效率。该算法的时间复杂度为O(m*n),其中m和n分别为主串和模式串的长度。 3. KMP字符串模式匹配算法:是一种高效的字符串匹配算法。它的核心思想是利用模式串自身的特性,预处理出一个next数组,使得在匹配过程中,当出现不匹配的情况时,可以通过next数组中的信息,跳过一部分比较,从而提高匹配效率。具体实现方法是,在预处理next数组时,从模式串的开头开始,计算出每个位置对应的最长前缀和最长后缀的公共部分长度,保存在next数组中。在匹配过程中,当出现不匹配的情况时,根据next数组中的信息,将模式串的起始位置向后移动一定的距离,从而跳过一些比较。该算法的时间复杂度为O(m+n),其中m和n分别为主串和模式串的长度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值