KMP算法

最新推荐文章于 2024-10-16 00:00:43 发布

lcw_202

最新推荐文章于 2024-10-16 00:00:43 发布

阅读量692

点赞数

文章标签：算法 comments rss 2010 c

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lcw_202/article/details/5378736

版权

字符串匹配 – KMP算法

Posted in 2010-01-24 2:27 PM Julius Chen No Comments »

KMP算法是由D. E. Knuth，J. H. Morris和V. R. Pratt提出来的一种字符串匹配改进算法，和BF算法相比，KMP算法的最大特点是主串指针不回溯，当匹配失败后，由之前比较所得的信息来决定模式串中的哪个字符和主串指针所指字符再比较。因此这个算法涉及到的主要问题就是求匹配失败之后，应该用模式串中哪个字符和主串指针所指字符再比较。

假设主字符串为S₀ S₁ S₂ … S_n，模式串为P₀ P₁ P₂ … P_m，匹配失败时，主串指针所指位置为S_i，模式串指针所指位置为P_j。若接下来主串字符S_i（i指针不回溯）应与模式串中第k(k < j)个字符继续比较，则模式串中前k-1个字符必须满足下列关系式1)，且不可能存在更大的k' > k满足下列关系式1)。
1) P₁ P₂ … P_k-1 = S_i-k+1 S_i-k+2 … S_i-1

而由之前的比较可以得到的匹配结果是：
2) P_j-k+1 P_j-k+2 … P_j-1 = S_i-k+1 S_i-k+2 … S_i-1

因此，由式1)和2)可以推出：
3) P₁ P₂ … P_k-1 = P_j-k+1 P_j-k+2 … P_j-1

由式子3)，可以很清楚的看到，位置k的确定和主字符串无关，只要在模式串中找到满足式子3)的两个子串（子串越大越好），就可以确定k的位置。

KMP算法如下：

由于KMP算法有效的利用了之前比较所得的信息，主串指针不需要回溯。因此，和BF算法相比提高了模式匹配的效率，特别是在最坏的情况下。KMP算法的时间复杂度为O(n+m)。

Strings KMP算法, 字符串算法, 模式匹配

若非注明，本博客文章均属原创，转载请以链接形式注明出处
本文地址：http://www.juliuschen.com/archives/21.html

在上述博客中已经描述了KMP算法的基本流程，这里仅对get_next(...)函数中12行进行个说明

为什么12行中要用k = next[k]; 呢，这相当于又是一个模式匹配的问题：

0 1 2 3 4 5 6

a b c a b e f 当我们求6的next值时，5的next值已经求出为k=2，在5跟2比较时不等，那么下面需要如何在比较呢？

这就有演变成了一个模式匹配的问题

0 1 2 3 4 5 6

a b c a b e f

a b c a b e f

显然下一个要比较的值就是2的next值，即K=next[k]

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

lcw_202 CSDN认证博客专家 CSDN认证企业博客

码龄16年

49: 原创

18万+: 周排名

112万+: 总排名

32万+: 访问

: 等级

4662: 积分

62: 粉丝

30: 获赞

14: 评论

81: 收藏

私信

关注

热门文章

分类专栏

最新评论

Linux oops
愿执: 老哥，我想问一下“Pid: 1586, comm: insmod Not tainted (2.6.32-21-generic #32-Ubuntu)”这条信息中Not tainted后面括号里就是表明发出opps的内核版本吗
Linux页框级内存管理处理细节
qq_26268527: 请问为什么说第11a步避免了两个无辜的进程？是怎么避免的，为什么两个？谢谢
页描述符与物理地址(相关主题帖子总结)
wuxianglonghaohao: 问题1：在最后一级页表中的页表项，里面放的是页描述符（page descriptor）的物理地址还是某个页框(page frame)的物理地址。准确的说，页表项的高20项（32bit不开PAE）表示页框号，如果对页表项做一个与操作 pte &　PAGE_MASK，即将页表项的低12位置为0则表示该页框的物理基地址。这点区别希望大家别搞混了，以为页表项就只有物理基地址。
页描述符与物理地址(相关主题帖子总结)
jasonLee_lijiaqi: 真的解决我好久的疑问，万分感谢！
我看Buddy(伙伴)算法－到底是怎么"找朋友"的
gangjian68: 撸主，问一下，为什么map大小是size - 1而不是size？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。