对kmp字符串模式匹配中next函数值的算法的简单理解

对于软考中常见的kmp字符串模式匹配中next函数值的算法,一开始解决不知如何下手,经过多方查询有以下俩种解法:

第一种.首先应先理解以下名词前缀,后缀,部分匹配值

前缀: 指除了最后一个字符以外,一个字符串的全部头部组合

后缀: 指除了第一个字符以外,一个字符串的全部尾部组合

部分匹配值 :就是"前缀"和"后缀"的最长的共有元素的长度

以aba为例

"a"的前缀和后缀都为空集,共有元素的长度为0;

"ab"的前缀为[a],后缀为[b],共有元素的长度为0;

“aba"的前缀为[a, ab],后缀为[ba, a],共有元素为"a”,共有元素的长度1;

next数组:用来记录某个字符失配时j应该赋的值,与部分匹配值有关系。

第二种简易解法

j 1 2 3 4 5 6 7
模式串 a b a a b c a
next[j] 0 1 1 2 2 3 1

每个个位的解释
1.前两位必定为0和1。
2.计算第三位的时候,看第二位b的next值,为1,则把b和1对应的a进行比较,不同,则第三位a的next的值为1,因为一直比到最前一位,都没有发生比较相同的现象。
3.计算第四位的时候,看第三位a的next值,为1,则把a和1对应的a进行比较,相同,则第四位a的next的值为第三位a的next值加上1。为2。因为是在第三位实现了其next值对应的值与第三位的值相同。
4.计算第五位的时候,看第四位a的next值,为2,则把a和2对应的b进行比较,不同,则再将b对应的next值1对应的a与第四位的a进行比较,相同,则第五位的next值为第二位b的next值加上1,为2。因为是在第二位实现了其next值对应的值与第四位的值相同。
5.计算第六位的时候,看第五位b的next值,为2,则把b和2对应的b进行比较,相同,则第六位c的next值为第五位b的next值加上1,为3,因为是在第五位实现了其next值对应的值与第五位相同。
6.计算第七位的时候,看第六位c的next值,为3,则把c和3对应的a进行比较,不同,则再把第3位a的next值1对应的a与第六位c比较,仍然不同,则第七位的next值为1。

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 简单字符串模式匹配算法:也称为朴素字符串匹配算法,是一种基础的字符串匹配算法。它的思想是从主串的第一个字符开始,依次比较主串和模式串对应位置的字符是否相等,如果相等则继续比较,直到模式串所有字符都匹配成功,或者有一个字符不匹配为止。如果不匹配,则将主串的起始位置向后移动一位,重新开始匹配。该算法的时间复杂度为O(m*n),其m和n分别为主串和模式串的长度。 2. 首位字符串模式匹配算法:也称为BF算法(Brute Force),是一种改进的字符串匹配算法。它的思想是在简单字符串模式匹配算法的基础上,当发现主串某个字符与模式串的某个字符不匹配时,不是将主串的起始位置向后移动一位,而是将模式串的起始位置向前移动到上一次比较成功的位置之后的下一位,继续匹配。这样可以减少比较次数,提高匹配效率。该算法的时间复杂度为O(m*n),其m和n分别为主串和模式串的长度。 3. KMP字符串模式匹配算法:是一种高效的字符串匹配算法。它的核心思想是利用模式串自身的特性,预处理出一个next数组,使得在匹配过程,当出现不匹配的情况时,可以通过next数组的信息,跳过一部分比较,从而提高匹配效率。具体实现方法是,在预处理next数组时,从模式串的开头开始,计算出每个位置对应的最长前缀和最长后缀的公共部分长度,保存在next数组。在匹配过程,当出现不匹配的情况时,根据next数组的信息,将模式串的起始位置向后移动一定的距离,从而跳过一些比较。该算法的时间复杂度为O(m+n),其m和n分别为主串和模式串的长度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值