[数据结构]KMP算法(个人复习用)

此文用于个人记录,目的不在于讲解。

KMP算法用于串的模式匹配。

例:

(图转载于http://blog.csdn.net/joylnwang/article/details/6778316/)


个人理解:

                    KMP的关键就是在整个模式串中寻找与这个模式串前缀相同的子字符串,如上面的例子,模式串为“abcabcacab",串前缀"a","ab","abc","abca"均有相同的子字符串,而"abcab"就没有了。

                    通过'与前缀相同的子字符串'可创建一个NEXT表,来规定模式串某位匹配失败时,主串上该位下一次应匹配的模式串的位标。如上面例子的NEXT表为: 

                    获得这个NEXT表的步骤:

                  1. next[1] = 0,第一位匹配失败,模式串顺移一位。

                  2. next[2] = 1。

                  3.p[2] = b 不等于 p[1], 与前缀不同, 所以next[3] =1。

                  4.p[3] = c  不等于 p[1],与前缀不同,next[4]=1,但由于p[4]=p[1],主串中第四位一定不等于p[next[4]]即p[1],不需再比较,所以直接与p[next[1]]比较,即next[4] = 0。

                  5.p[4] = p[1], 所以next[5] = 2,但由于p[5]=p[2](理由同上),所以next[5] = next[2] = 1。
                  6.因为p[4] = p[1],所以此处比较p[5]与p[2],由于p[5]=p[2], 所以next[6] = 3,但由于p[6] = p[3], 所以next[6] = next[3] = 1。

                  7.p[1,2,3] = p[4,5,6],所以next[7] = 4,由于p[7] = p[4] ,所以next[7] = next[4] = 0。

                  8.p[1,2,3,4] = p[4,5,6,7],所以next[8] = 5。
                  9.p[8]不等于p[5],此处需注意,“abcac"不等于前缀"abcab",这又相当于一个新的模式匹配问题,"abcac"的”c"应该与”abcab"中的p[next[5]]比较,即p[8]与p[1]比较,不等, 所以next[9] = 1,由于p[9] = p[1], 所以next[9] = next[1] = 0。

                 10.p[9] = p[1] ,所以next[10] = 2,由于p[10] = p[2] ,所以next[10] = next[2] = 1。

         总结起来,算NEXT表的关键是找与前缀相同的子字符串,然后判断p[i]是否与p[next[i]]相等,若相等,则将next[i]改为next[next[i]],而且尤其注意第九步难以理解。

补充:以上KMP为最优的KMP,还有一种非最优的KMP,即没有p[i]与p[next[i]]的比较这一步。

                 

         

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值