数据结构 - 第四章 串与KMP算法

定义

串是由零个或多个字符组成的有限序列,又名叫字符串。即非数值的线性表。

字符串在计算机中的大小其实取决于它们挨个字母的前后顺序。

空串不含任何字符。

空格串,是只包含空格的串。空格串是有内容有长度的,而且可以不止一个空格。

子串与主串,串中任意个数的连续字符组成的子序列称为该串的子串,相应地,包含子串的串称为主串。子串在主串中的位置就是子串的第一个字符在主串中的序号。

模式匹配即在主串中定位子串。

 

BM算法

基本思想是对主串的每一个字 符作为子串开头,与要匹配的字符串进行匹配。对主串做大循环,每个字符开头做T的长度的小循环,直到匹配成功或全部遍历完成为止。

思想简单,但是效率极低。整个算法的时间复杂度为O((n-m+1)*m)。

 

KMP算法

基本思想是利用已经得到的部分匹配结果将模式向右滑动尽可能远一段距离后,继续进行比较。在整个匹配的过程中,i指针没有回溯。 j 最大前后缀就是 next[i] 的值。我们把T串各个位置的 j 值的变化定义为一个数组 next,那么 next 的长度就是T串的长度。于是我们可以得到下面的函数定义:

例:

整个算法的时间复杂度为O(n+m)。

但是KMP还是存在缺陷,因此出现了改进版的KMP算法,将 next 数组改为 nextval 数组。

例:

总结改进过的KMP算法,它是在计算出 next 值的同时,如果a位字符与它 next 值指向的b位字符相等,则该a位的 nextval 就指向b位的 nextval 值,如果不等,则该a位的 nextval 值就是它自己a位的next的值。

 

参考教材:

《数据结构与算法》,熊岳山著,清华大学出版社,2016,第二版

《2020年数据结构考研复习指导》,电子工业出版社,2020

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值