小白如何理解kmp算法

前置知识

1.什么是前缀

1.1概念:前缀表示的是不含最后一个字符的串
例如:aabcf的前缀是aabc,aab, aa, a

2.什么是后缀

2.1概念:后缀表示不含第一个字符的串
例如:aabcf的后缀是abcf, bcf, cf, f

3.什么是最长相等前后缀

3.1概念:前缀和后缀的内容相同,且长度最长
例如:aabaa中前缀有aaba,aab,aa,a后缀有abaa,baa**,aa,a**
可以看出来相同的部分有aa和a,那么最长的相等长度是aa,也就是长度为2

4.为什么要引入最长相等前后缀这个概念?

1.比如又一个字符串A为:aabaafaabaac,字符串B为aabaac,我们想判断字符串B是否包含在字符串A中。比较直观的判断是

# 第一步
aabaafaabaac
aabaac
#第二步
aabaafaabaac
 aabaac
#第三步
aabaafaabaac
  aabaac
............
............
............
# 最后一步(匹配成功,B在A中)
aabaafaabaac
      aabaac

2.这种判断的方式比较粗暴,每次匹配失败,A串向后移动一个字符,B串从A串移动后的哪个字符重新开始匹配,显然效率非常低。那么有什么方法可以优化这个过程呢?
因为我们第一次遍历的时候已经把子串都过了一遍,那么我们可以保留下一定的信息记录这次遍历的过程。那么这个一定的信息是什么呢?他就是Next数组

想象一下,我们找一下前缀部分有没有和后缀部分相同的,直接移动前缀部分和之前后缀部分相同的重叠,如果没有重叠部分,字串从最开始的那个元素重新开始比较,然后指针从这之后继续比较,是不是大大优化了效率

aab**aa**faabaac
   **aa**baac

这部分的特色就是A串不动,B串不断的向前移动,并且根据前缀和后缀不断调整

具体实现

1.kmp算法最核心是求next数组,那么如何求出next数组是一个核心问题。
2.例如给你一个字符串“aabaaf”,求出他的next数组。
3.那什么是next数组呢?next数组就是求出一个给定字符串的所有子串的最长相等前后缀。
4.以字符串aabaaf具体next数组就是求出a,aa,aab,aaba,aabaa,aabaaf的最长相等前后缀,放入这个next数组中。

代码实现

1.next数组实现代码

def fun(s): # s表示传入的模式串
	j = 0 # 前缀末尾,也表示i的最长相同前后缀
	next = [0] # 初始元素的Next值为0
	for i in range(1, len(s)): # i表示后缀末尾
		# 不相同的情况,跳到前一个位置
		while j > 0 and s[i] != s[j]:
			# 理解为前缀和后缀的匹配方式和主串模式串的匹配方式一样
			j = next[j-1]
		# 相同的情况
		if s[i] == s[j]:
			j += 1
		next.append(j)
	return next
  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值