串的模式匹配算法


1、求子串位置的定位函数

子串的定位操作通常称做串的模式匹配,是各种串处理系统中最重要的操作之一。现采用定长顺序存储结构,可以写出简单匹配算法。

int Index(SString S,SString T,int pos)
{
	int i,j;
	i=pos,j=1;
	while(i<=S[0]&&j<=T[0]){
		if(S[i]==T[j]){++i,++j;}
		else{i=i-j+2;j=1;}
	}
	if(j>T[0]) return i-T[0];
	else return 0;
}



i和j指针分别指示主串和模式串中当前正待比较的字符位置。算法描述:从主串S的第pos个字符起和模式的第一个字符比较,若相等,则继续逐个比较后继字符;否则从主串的下一个字符起再重新和模式的字符比较。此算法的时间复杂度为O(n*m),其中n和m分别为主串和模式的长度。此算法易引起指针i的多次回溯。

2、改进算法——KMP算法
KMP算法的改进在于:每当一趟匹配过程中出现字符比较不等时,不需回溯i指针,而是利用已经得到的“部分匹配”的结果将模式向右滑动尽可能远的一段距离后,继续进行比较。
int Index__KMP(SString S,SString T,int pos)
{
	int i,j;
	i=pos,j=1;
	while(i<=S[0]&&j<=T[0]){
		if(j==0||S[i]==T[j]){++i,++j;}
		else j=next[j];
	}
	if(j>T[0]) return i-T[0];
	else return 0;

}

令next[j]=k,其表明当模式中第j个字符与主串中相应字符失配时,在模式中需重新和主串中该字符进行比较的字符的位置。
求next数组的函数及修正的next数组的函数如下:

<pre name="code" class="cpp">void get_next(SString T,int next[])
{
	int i=1,j=0;
	next[1]=0;
	while(i<T[0])
	{
		if(j==0||T[i]==T[j])
		{
	++i,++j;
	next[i]=j;}
		else j=next[j];
	}
}


 
void get_nextval(SString T,int nextval[])
{
	int i=1,j=0;
	nextval[1]=0;
	while(i<T[0]){
		if(j==0||T[i]==T[j]){
	++i,++j;
	if(T[i]!=T[j])
	nextval[i]=j;
	else nextval[i]=nextval[j];
	}
		else j=nextval[j];
	}
}


 
 






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值