KMP字符串匹配

可行性

最长公共前后缀

前缀

  1. 除了最后一个字符以外的所有的头部组合
  2. 字符串S的所有前缀表示为S[1…i], 其中i为[1…len(S)-1]

后缀

  1. 除了第一个字符以外全部的尾部组合
  2. 字符串S的所有后缀表示为S[i…len(S)], 其中i为[len(S)…2]

最大公共前后缀

  1. 找到一组长度最长的而且相等的前缀与后缀
  2. ?[q]表示为:字符串S中1到q的字符串的最长公共前后缀的长度

证明偏移的量等于最大公共前后缀

在这里插入图片描述

  1. P中第6个字符c与T中的a无法匹配, 需要偏移s来找下一个子串看能不能匹配
  2. 对偏移量s’ = s+1进行偏移的话是不会成功的, 因为P中最长公共前后缀?[5]=3, 如果能偏移说明能找到更长的公共前后缀, 故矛盾。因此baba不可能是P的前缀因此对abab的匹配不可能成功
  3. 对偏移量s’ = s+2是有可能成功的, 偏移之后再比较剩下的字符
def get_next(str):
	if len(str) == 0:
		return []
	if len(str) == 1:
		return [-1]
	next = [0 for _ in range(len(str))]
	next[0] = -1
	next[1] = 0
	pre = 0
	i=2

	while i!=len(str):
		if str[i-1] == str[pre]:
			next[i] = pre + 1
			pre += 1
			i += 1
		else:
			if pre>0:
				pre = next[pre]
			else:
				next[i] = 0
				i += 1
	return next
def kmp(a,b):
	if (a == '') & (b ==''):
		return 0
	next = get_next(b)
	i = 0
	j = 0
	while True:
		if j == len(b):
			return i-j
		if i == len(a):
			return -1
		if a[i] == b[j]:
			i += 1
			j += 1
		else:
			if j != 0:
				j = next[j]
			else:
				i += 1

print(kmp('aabaaabaaac','aabaaac'))
输出结果为4

参考文献

  1. 《算法导论》第三版
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值