BF算法以及KMP算法(待完善)

BF算法

在匹配一个字符串,是否是另外一个字符串的子串时,我们通常来讲想到一个最简单易懂的算法,如下图所示,先拿出字串T的零位和主串S进行配对,如果配对成功,这个时候主串的后面的字符串便拥有了和子串T完全配对的可能性,我们需要进行下一步的配对。
在这里插入图片描述
如上图,S[0]与T[0]配对成功,我们便进入配对过程,一直到S[6]与T[6]配对失败,
在这里插入图片描述
这个时候我们需要回到与T[0]配对成功的时候,并将S串箭头+1,T串箭头维持在T[0]处,即S[1]与T[0]匹配,如果不匹配则S串箭头继续往后走,如果匹配则重复上面步骤。
在这里插入图片描述
动图如下:
在这里插入图片描述
在理解了BF算法之后,贴上代码:

int Bf(char *S, char *T)
{
	int SL = strlen(S);
	int TL = strlen(T);
	
	int i = 0, j = 0;
	
	while(i < SL && j < TL)
	{
		if(S[i] == T[j])
		{ //如果匹配成功
			i++;
			j++; 
		}
		else
		{
			//匹配失败 
			//子串回到0,主串回到匹配成功前+1;
			i = i - j + 1; 
			j = 0;
		}
	 } 
	 //匹配成功,返回子串T在主串S中的位置,否则返回-1
	if(j == TL) 
	 	return i - j;
	else
		return -1;
}

KMP算法之next数组

最近看了kmp算法,找了无数的视频资料以及无数网页版教学资料,总之看的很是头痛,所以准备记下自己学习过程中的一些感悟。

三问next数组
1、为啥要用next数组?
众所周知,next数组是kmp算法的核心,和bf算法比起来就是为了减少回溯过程中的不必要的步骤,达到减少时间复杂度和空间复杂度的目的。
2、那么问题来了,如何减少呢呢?
先推荐一个号称汪都能听懂的KMP算法视频!
https://www.bilibili.com/video/av3246487?from=search&seid=2744545296647112060
我们先了解一下串中的前缀和后缀:
在这里插入图片描述
j为字符串T的下标。(国内教科书上很多讲解从1开始,我很不能理解,计算机中为啥还要用1作为起始点)
如下图所示,S是主串,T是子串,现在我们从第0位开始进行匹配。
在这里插入图片描述
当一直匹配到S[5]和T[5]时,前面都是相等的,如下图所示。
在这里插入图片描述
但是S[6]与T[6]并不相等,根据BF算法,如下图所示,我们要对S[1]和T[0]再进行判断,这样虽然思想很简单,结果不会出错,但是却浪费时间。
在这里插入图片描述
于是我们根据上文可以得到:我们对T[0]~T[5],与S[0] ~S[5]进行了匹配并且相等,就是这两个字符串的这一段对我们来讲是已知的,那为啥我们还要继续回到S[1]再进行匹配呢?
既然T[0] ~T[5],与S[0] ~S[5]相等,所以我们对T[0] ~T[5]进行处理,就等同于对S[0] ~S[5]进行处理。
这个时候D.E.Knuth,J.H.Morris和V.R.Pratt这三个人就给出了一个非常好的处理办法,那就是找到最大对称串。如下图,abacab的最大对称串为ab,
在这里插入图片描述
那为什么要找最大对称串呢?我们看一下下面的动图:
在这里插入图片描述
由上图我们可知,我们每次将子串T往右移动一格进行比较,看上去是T在和S配对,其实是S前面abacab在和T的abacab进行配对,所以我们通过找到abacab的规律来减少多余的配对步骤。
这个规律就是寻找abacab的规律,他的最大对称串为ab,所以直接将前缀ab移动到后缀ab的位置即可。
对称性,我们直接判断S[6]和T[2]是否相等。省去了S[1]到S[5]再进行判断,
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值