数据结构之串的学习

数据结构之串的学习


一、串的模式匹配

1.串的模式匹配概念:
两个串s和t,要在串s中找到与t相等的子串。通常将s称为目标串,t称为模式串,这种串的定位查找也称为模式匹配。
2.串的存储结构:
定长顺序串、堆串、顺序串
3.串的模式匹配算法:
(1)BF模式匹配算法:

算法思想:
从主串S中的第pos个字符开始,与模式串T的第一个字符进行比较,直到找到相同的子串为止。如果存在相同的子串,则匹配成功,返回字串在主串S中的位置pos,否则匹配不成功。

比较策略:从前往后依次比较,回溯
在这里插入图片描述

代码实现:

int Index(SString,int pos,SString T) 
{
	int i=pos,j=1;//从主串的第pos个位置开始,从模式串的第一个字符开始
	while(i<=S.len&&j<=T.len)
	{
		if(S.ch[i] ==T.ch[j]//找到相同的字符时,继续你叫后续的字符
		{
			++i;
			++j;
		}
		else
		{
			i=i-j+2;//没有找到相同的字符时,主串回溯到pos+1,即i-j+2的位置重新比较
			j=1;//模式串从头开始比较
		}
	} 
	if(j>T.len)//匹配成功返回匹配的初始位置
	{
		return i-T.len;
	}
	else
	{
		return 0;//匹配失败返回0
	}
}

算法分析:
设n为主串的长度,m为模式串的长度,则在最坏的情况下算法的时间复杂度为O(n*m)。BF算法的时间耗费在匹配失败后的比较位置要回溯,因此在需要反复回溯的情况下此算法效率并不高。

(2)KMP模式匹配算法:
<1>算法

算法思想:
从主串S中的第pos个字符开始,与模式串T的第一个字符进行比较,如果匹配失败,主串S中的i不需要回溯,而是利用已知模式串next将模式串向后移动尽可能远的一段距离后继续进行比较。

主串从i=1的位置开始,与模式串的j=1个字符开始比较,比较到第主串i=3的位置时匹配失败,此时无需将主串第一个字符从头开始比较,仅需将模式串向右滑动滑动,保持i不变,使得主串和移动后的模式串继续比较。
代码实现:

int Index(SString,int pos,SString T) 
{
    int i=pos,j=1;
    while(i<=S.len&&j<=T.len)//主串从第pos个字符开始,模式串从第一个字符开始 
    {
    	if(j==0||S.ch[i]==T.ch[j])
    	{
    		++i;
    		++j;
		}
		else
		{
			j=next[j];//模式串向右移动 
	    }
	}
	if(j>T.len0)
	{
		return i-T.len;//匹配成功返回匹配的初始位置 
	}
	else
	{
		return 0;//匹配失败返回0
	}
}

算法分析:KMP算法不需要主串i回溯,时间复杂度为O(n+m)

那么模式串可向右滑动的距离是多少呢?

<2>next数组推导

假设此时主串中字行Si应与模式中字符Tk(k<j)继续进行 比我,则主串S 和模式串T满足如下关系:
在这里插入图片描述
可以看出,若模式串中存在T1T2…Tk-1 = Tj-k+1Tj-k+2…Tj-1,且满足 1<k<j,则当匹配过程中Si不等于Tj;时,仅需将模式串向右滑动至第k个字符和主串中第i个字符对齐,匹配仅需从Si、Tk的此较继续进行,无需i指针的回溯。在匹配过程中为了不错过任何可能的成功匹配,因而应选备满足条件的最大k值。
若令 next[j]=k,则next[]表明当模式中第j个子符与主串中相应字符“失配”时,在模式串中需重新找到和主串中该字符进行比较的字符位置。由此可引出模式串的 next 函数的定义:
在这里插入图片描述
由此可见next函数的计算仅和模式串本身有关而和主串无关。

举例说明:
在这里插入图片描述
在这里插入图片描述

二、KMP算法改进

1.算法优化

优化方法:在匹配时减少回溯次数,以主串部分ababac和子串ababax匹配为例,显然两段末尾不同,但是计算机需要将前面都匹配一遍,直到最后,回溯时可能一次也回不到相应位置,造成循环次数增加,所以在next[]数组的基础上推导出更为合理的回溯方案nextval[]数组回溯

2.nextval数组

下面是计算模式串T='aaaab’的nextval值的过程:

在这里插入图片描述

在这里插入图片描述

nextval算法代码如下:

void Get_NextVal(SString T,int next[],int nextval[])
{
	int j=2,k=0;
	Get_Next(T,next);
	nextval[1]=0;
	while(j<T.len)
	{
		k=next[j];
		if(T.ch[j]==T.ch[k])
		{
			nextval[j]=nextval[k];
		}
		else
		{
			nextval[j]=next[j];
		}
		j++;
	}
}

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值