咸鱼程序员之-算法第二篇-KMP算法

KMP算法 是经典的字符串匹配算法 ,相对于暴力匹配算法来说 效率要高得多 。

KMP算法是又三位BIG OLD(KAN MAO PIAN ) D.E.Knuth、J.H.Morris和V.R.Pratt一起发明的神级算法 。。。 

KMP算法要解决的问题就是在字符串(也叫主串)中的字串(pattern)定位问题  

如果字串在一个主串中完全匹配,就返回它的首位下标,否则返回-1。。。。

通常我们最容易想到的匹配思想是暴力匹配(如果暴力匹配不懂可以看我第一篇算法)。这种思想就是如果不匹配主串下标向后移动一位 字串重新从第一位开始匹配。

KMP算法的整体思路是什么样子呢?让我们来看一组例子:

第一轮,模式串和主串的第一个等长子串比较,发现前5个字符都是匹配的,第6个字符不匹配,是一个“坏字符”:

 

我们可以发现,在前缀“GTGTG”当中,后三个字符“GTG”和前三位字符“GTG”是相同的:

在下一轮的比较时,只有把这两个相同的片段对齐,才有可能出现匹配。这两个字符串片段,分别叫做最长可匹配后缀子串和最长可匹配前缀子串。

第二轮,我们直接把模式串向后移动两位,让两个“GTG”对齐,继续从刚才主串的坏字符A开始进行比较:

显然,主串的字符A仍然是坏字符,这时候的匹配前缀缩短成了GTG:

 

 

按照第一轮的思路,我们来重新确定最长可匹配后缀子串和最长可匹配前缀子串:

 

第三轮,我们再次把模式串向后移动两位,让两个“G”对齐,继续从刚才主串的坏字符A开始进行比较:

 

以上就是KMP算法的整体思路,至于这里的最长匹配字串就不具体阐述了 。总之,

如果不匹配,则字串的下标不要进行回溯 ,字串所要移动的位置=前面已经匹配的字符串长度-匹配标对应的前一个的值。

下面献上小编的java 代码实现部分:

思路: 我们需要实现两个方法 ,一个是获取匹配表,第二个就是搜索。

1.获取匹配表

 

2 搜索实现

okay 测试方法测试一下:

我们发现 结果是理想的,,,虽然第一次看起来有点难度,但是仔细研究下不算很难。希望对你有所帮助。。。。。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值