KMP算法 是经典的字符串匹配算法 ,相对于暴力匹配算法来说 效率要高得多 。
KMP算法是又三位BIG OLD(KAN MAO PIAN ) D.E.Knuth、J.H.Morris和V.R.Pratt一起发明的神级算法 。。。
KMP算法要解决的问题就是在字符串(也叫主串)中的字串(pattern)定位问题
如果字串在一个主串中完全匹配,就返回它的首位下标,否则返回-1。。。。
通常我们最容易想到的匹配思想是暴力匹配(如果暴力匹配不懂可以看我第一篇算法)。这种思想就是如果不匹配主串下标向后移动一位 字串重新从第一位开始匹配。
KMP算法的整体思路是什么样子呢?让我们来看一组例子:
第一轮,模式串和主串的第一个等长子串比较,发现前5个字符都是匹配的,第6个字符不匹配,是一个“坏字符”:
我们可以发现,在前缀“GTGTG”当中,后三个字符“GTG”和前三位字符“GTG”是相同的:
在下一轮的比较时,只有把这两个相同的片段对齐,才有可能出现匹配。这两个字符串片段,分别叫做最长可匹配后缀子串和最长可匹配前缀子串。
第二轮,我们直接把模式串向后移动两位,让两个“GTG”对齐,继续从刚才主串的坏字符A开始进行比较:
显然,主串的字符A仍然是坏字符,这时候的匹配前缀缩短成了GTG:
按照第一轮的思路,我们来重新确定最长可匹配后缀子串和最长可匹配前缀子串:
第三轮,我们再次把模式串向后移动两位,让两个“G”对齐,继续从刚才主串的坏字符A开始进行比较:
以上就是KMP算法的整体思路,至于这里的最长匹配字串就不具体阐述了 。总之,
如果不匹配,则字串的下标不要进行回溯 ,字串所要移动的位置=前面已经匹配的字符串长度-匹配标对应的前一个的值。
下面献上小编的java 代码实现部分:
思路: 我们需要实现两个方法 ,一个是获取匹配表,第二个就是搜索。
1.获取匹配表
2 搜索实现
okay 测试方法测试一下:
我们发现 结果是理想的,,,虽然第一次看起来有点难度,但是仔细研究下不算很难。希望对你有所帮助。。。。。