KMP算法之next数组的实现

KMP算法之next数组的实现

上文,我们讲到了KMP算法的理论基础,其中最重要的是由最大相等前后缀组成的前缀表,在这里,前缀表所代表的数组,就是我们所谓的next数组
首先我们要知道,KMP算法解决的是两个字符串相匹配的问题,而我们的next数组,是对应其中待匹配的字符串,即较短的字符串的。
实际上,相对于同一个字符串,由于代码的具体实现不同,我们可以拥有不同的next数组。就像是有人喜欢用下标为1的位置保存第一个元素,而有的人喜欢用下表为0的位置保存一样,其底层逻辑是一样的
在这里插入图片描述

让我们观察上图的两个next数组,可以看到,next2数组实际上就是next1数组全体向右移动一位再加一,最后在首位补0。而获得两个next数组的方法,在代码的实现中也会有细小的差别。其中,我们得到next1的方法,与我们上一篇文章得到前缀表的逻辑是一样的。我会将上文的链接放在文章最后。接下来,让我们讲讲如何通过代码得到next1数组。
在这里插入图片描述

在代码中,我们用元素 i 来遍历字符串中的每一个字母,首先将求得的最大相等前后缀赋值给我们的next [ i ],然后 i ++找到下一个字母。当 i 遍历完我们的整个数组后,我们就可以得到一个对应的前缀表。也就是我们的next数组。而 j 的作用就比较复杂,它的作用是统计每一个字母所对应字符串的最大相等前后缀。而对应不同的情况,我们将对 j 有不同的处理方式。

以上代码将所有情况分为三个部分。

在这里插入图片描述

第一部分:我们用另外一个更加利于理解的例子:“abcdabc" 。它的next数组是:0 0 0 0 1 2 3。长度len==7。当我们的 i 为4,也就是第二个a的下标ch[i]=ch[4]=‘a’ 。此时 j 还是0,ch[j]=ch[0]=‘a’ ,此时ch[i]=ch[j],这就来到了我们的第一种情况。

++j为1,next[i]=next[4]=++j=1,然后i++。i变为5,j变为1。又ch[i]=ch[j]=‘b’,重复以上动作,next[5]=2,i变为6,j变为2。又ch[i]=ch[j]=‘c’,重复以上动作,next[6]=3,i变为7,j变为3。又i==len,跳出循环。

从第一部分我们可以看出,j 起到一个累加的作用。而中间有不匹配的,j就会逐步清零。当然这是后话。

在这里插入图片描述

第二部分:比较有趣,关键是考验是考验大家关于前缀表的理解。首先我们知道,来到了第二部分,意味着第一部分的条件不成立。即ch[ i ] !=ch [ j ]。又此时 j 为0,ch [ j ]代表着首字母,意味着我们要从ch[i]对应的字母开始,与字符串的首字母开始匹配。又ch[ i ] !=ch [ j ],匹配不上,所以在这里 j 也无法++。所以,ch[i] 对应的最大相等前后缀为零。即把next[i] 置为0,然后 i++ 找下一个字母。

在这里插入图片描述

第三部分:是代码量最少,但也最关键的部分。
它代表绝大部分的情况,也就是 j != 0,并且 ch[i]!=ch[j]的情况。实际上,只有当第一部分的代码持续了几个循环后,j才能大于零。但是在这里却断了,因为ch[i]!=ch[j],j 不能再执行j++。
打个比方,就是老祖宗几代传下来的经验,却碰到了一个败家子。财产非但难以保存,还有被挥霍一空的风险。
这时,j可能变成一,甚至变为0从头开始

讲解完next1的代码实现,我们再来完成next2的代码实现,这里就不再过多赘述,两者背后的原理大同小异。

在这里插入图片描述
到了这里,我们便完成了next数组的代码实现。希望大家有所收获。

这是讲KMP算法的底层逻辑,有代码的实现思想和next1的手动计算方法:
http://t.csdnimg.cn/YWifX

  • 23
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值