[数据结构]KMP算法(个人复习用)

最新推荐文章于 2024-06-29 08:43:42 发布

Russius

最新推荐文章于 2024-06-29 08:43:42 发布

阅读量517

点赞数

分类专栏：数据结构学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Russius/article/details/78171682

版权

数据结构学习笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

此文用于个人记录，目的不在于讲解。

KMP算法用于串的模式匹配。

例：

（图转载于http://blog.csdn.net/joylnwang/article/details/6778316/）

个人理解：

KMP的关键就是在整个模式串中寻找与这个模式串前缀相同的子字符串，如上面的例子，模式串为“abcabcacab"，串前缀"a","ab","abc","abca"均有相同的子字符串，而"abcab"就没有了。

通过'与前缀相同的子字符串'可创建一个NEXT表，来规定模式串某位匹配失败时，主串上该位下一次应匹配的模式串的位标。如上面例子的NEXT表为：

获得这个NEXT表的步骤：

1. next[1] = 0，第一位匹配失败，模式串顺移一位。

2. next[2] = 1。

3.p[2] = b 不等于 p[1], 与前缀不同，所以next[3] =1。

4.p[3] = c 不等于 p[1],与前缀不同，next[4]=1，但由于p[4]=p[1]，主串中第四位一定不等于p[next[4]]即p[1]，不需再比较，所以直接与p[next[1]]比较，即next[4] = 0。

5.p[4] = p[1], 所以next[5] = 2,但由于p[5]=p[2](理由同上),所以next[5] = next[2] = 1。
6.因为p[4] = p[1]，所以此处比较p[5]与p[2],由于p[5]=p[2], 所以next[6] = 3,但由于p[6] = p[3], 所以next[6] = next[3] = 1。

7.p[1,2,3] = p[4,5,6],所以next[7] = 4,由于p[7] = p[4] ,所以next[7] = next[4] = 0。

8.p[1,2,3,4] = p[4,5,6,7],所以next[8] = 5。
9.p[8]不等于p[5],此处需注意，“abcac"不等于前缀"abcab",这又相当于一个新的模式匹配问题，"abcac"的”c"应该与”abcab"中的p[next[5]]比较，即p[8]与p[1]比较，不等，所以next[9] = 1,由于p[9] = p[1], 所以next[9] = next[1] = 0。

10.p[9] = p[1] ,所以next[10] = 2,由于p[10] = p[2] ,所以next[10] = next[2] = 1。

总结起来，算NEXT表的关键是找与前缀相同的子字符串，然后判断p[i]是否与p[next[i]]相等，若相等，则将next[i]改为next[next[i]]，而且尤其注意第九步难以理解。

补充：以上KMP为最优的KMP,还有一种非最优的KMP，即没有p[i]与p[next[i]]的比较这一步。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Russius CSDN认证博客专家 CSDN认证企业博客

码龄9年

12: 原创

38万+: 周排名

214万+: 总排名

6万+: 访问

: 等级

757: 积分

16: 粉丝

31: 获赞

8: 评论

104: 收藏

私信

关注

热门文章

分类专栏

最新评论

[计算机原理]BCD码减法
做而论道_CS: BCD 码，怎么表示负数？如，－27，你怎么表示？
[计算机原理]补码运算原理
做而论道_CS: 由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1；如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。　例如，有一个补码：1110 0000，它代表的十进制是：－128 + 64 + 32 = －32。再看，另一个补码：0110 0000，它代表的十进制是：0 + 64 + 32 = ＋96。仅仅做一次【进制转换】，这不就完事了嘛！
[计算机原理]补码运算原理
做而论道_CS: 负数，与其对应的正数，可以直接换算。根本就不用考虑：　机器数真值符号位原码反码补码补码正数三码相同　负数取反加一符号位不变模同余符号位也参加运算 ... 这些毫无用处的垃圾！你就是把这些全背下来了，你也不可能理解：　加法，怎么就代替了减法？
[计算机原理]补码运算原理
做而论道_CS: 99、255，都能当－1 ！这是为什么呢？绝对不是 “符号位原码反码取反加一补码...”。而是【你舍弃了进位】！舍弃进位，也就是减去了进位。两位十进制，你舍弃了一百（= 10^2）。八位二进制，你舍弃了 2^8 = 256。那么，加上 99，再舍弃一百，也就是，加上了： 99－100 = －1。那么，加上 255，再舍弃 256，也就是，加上了： 255－256 = －1。加上 254，再舍弃 256，也就是，加上了： 254－256 = －2。。。。这些代替负数的正数，就被计算机专家，称为了：补码。其实，它们仍然是数，并不是什么什么码。而且，“补码”，本是数学中的普遍规律。并非是二进制才有。也并非是计算机专家的发明！计算机专家，贪天之功作为己有，真不要 FACE 了！
[计算机原理]补码运算原理
做而论道_CS: 计算机的字长，是固定的。八位二进制数的范围是：0000 0000 ~ 1111 1111。即，十进制的：0 ~ 255。这个 255，也可以当做－1 使用！如 27－1 = 26，八位机将如下计算：　　　0001 1011 　　＋1111 1111　　(即 255) －－－－－－－－－ (进 1 ) 0001 1010 舍弃进位，保留八位结果，就是 26。这就用加法，实现了减法运算。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。