BF算法以及KMP算法（待完善）

最新推荐文章于 2024-07-25 17:43:13 发布

weixin_42971090

最新推荐文章于 2024-07-25 17:43:13 发布

阅读量110

点赞数

分类专栏：数据结构文章标签： kmp BF 数据结构

本文链接：https://blog.csdn.net/weixin_42971090/article/details/100977032

版权

数据结构专栏收录该内容

6 篇文章 0 订阅

订阅专栏

BF算法

在匹配一个字符串，是否是另外一个字符串的子串时，我们通常来讲想到一个最简单易懂的算法，如下图所示，先拿出字串T的零位和主串S进行配对，如果配对成功，这个时候主串的后面的字符串便拥有了和子串T完全配对的可能性，我们需要进行下一步的配对。
在这里插入图片描述
如上图，S[0]与T[0]配对成功，我们便进入配对过程，一直到S[6]与T[6]配对失败，

这个时候我们需要回到与T[0]配对成功的时候，并将S串箭头+1，T串箭头维持在T[0]处，即S[1]与T[0]匹配，如果不匹配则S串箭头继续往后走，如果匹配则重复上面步骤。
在这里插入图片描述
动图如下：

在理解了BF算法之后，贴上代码：

int Bf(char *S, char *T)
{
	int SL = strlen(S);
	int TL = strlen(T);
	
	int i = 0, j = 0;
	
	while(i < SL && j < TL)
	{
		if(S[i] == T[j])
		{ //如果匹配成功
			i++;
			j++; 
		}
		else
		{
			//匹配失败 
			//子串回到0，主串回到匹配成功前+1；
			i = i - j + 1; 
			j = 0;
		}
	 } 
	 //匹配成功，返回子串T在主串S中的位置，否则返回-1
	if(j == TL) 
	 	return i - j;
	else
		return -1;
}

KMP算法之next数组

最近看了kmp算法，找了无数的视频资料以及无数网页版教学资料，总之看的很是头痛，所以准备记下自己学习过程中的一些感悟。

三问next数组
1、为啥要用next数组？
众所周知，next数组是kmp算法的核心，和bf算法比起来就是为了减少回溯过程中的不必要的步骤，达到减少时间复杂度和空间复杂度的目的。
2、那么问题来了，如何减少呢呢？
先推荐一个号称汪都能听懂的KMP算法视频！
https://www.bilibili.com/video/av3246487?from=search&seid=2744545296647112060
我们先了解一下串中的前缀和后缀：
在这里插入图片描述
j为字符串T的下标。（国内教科书上很多讲解从1开始，我很不能理解，计算机中为啥还要用1作为起始点）
如下图所示，S是主串，T是子串，现在我们从第0位开始进行匹配。

当一直匹配到S[5]和T[5]时，前面都是相等的，如下图所示。
在这里插入图片描述
但是S[6]与T[6]并不相等，根据BF算法，如下图所示，我们要对S[1]和T[0]再进行判断，这样虽然思想很简单，结果不会出错，但是却浪费时间。

于是我们根据上文可以得到：我们对T[0]~T[5]，与S[0] ~S[5]进行了匹配并且相等，就是这两个字符串的这一段对我们来讲是已知的，那为啥我们还要继续回到S[1]再进行匹配呢？
既然T[0] ~T[5]，与S[0] ~S[5]相等，所以我们对T[0] ~T[5]进行处理，就等同于对S[0] ~S[5]进行处理。
这个时候D.E.Knuth，J.H.Morris和V.R.Pratt这三个人就给出了一个非常好的处理办法，那就是找到最大对称串。如下图，abacab的最大对称串为ab，
在这里插入图片描述
那为什么要找最大对称串呢？我们看一下下面的动图：

由上图我们可知，我们每次将子串T往右移动一格进行比较，看上去是T在和S配对，其实是S前面abacab在和T的abacab进行配对，所以我们通过找到abacab的规律来减少多余的配对步骤。
这个规律就是寻找abacab的规律，他的最大对称串为ab，所以直接将前缀ab移动到后缀ab的位置即可。
对称性，我们直接判断S[6]和T[2]是否相等。省去了S[1]到S[5]再进行判断，
在这里插入图片描述

weixin_42971090

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
BF算法以及KMP算法（待完善）

KMP算法之next数组最近看了kmp算法，找了无数的视频资料以及无数网页版教学资料，总之看的很是头痛，所以准备记下自己学习过程中的一些感悟。三问next数组1、为啥要用next数组？众所周知，next数组是kmp算法的核心，和bf算法比起来就是为了减少回溯过程中的不必要的步骤，达到减少时间复杂度和空间复杂度的目的。那么问题来了，如何减少呢呢？先推荐一个号称汪都能听懂的KMP算法视频，...
复制链接

扫一扫

专栏目录