KMP模式匹配算法
-
模式匹配算法为了寻找子串在主串中的起始位置,即Java中String的一个方法
public int indexOf(String str); // 返回指定字符串在此字符串中第一次出现处的索引。
-
对于主串
S
和模式串T
,普通的模式匹配算法(暴力匹配)就是挨个遍历S
中的字符,将以该字符开头的子串去与模式串T
比较,如果相等就返回相应位置,否则就继续遍历下一个字符。假设主串S
和模式串T
的长度分别为m
和n
,那么该时间复杂度为O(mn)
。 -
KMP算法一种改进的模式匹配算法,由D.E.Knuth、V.R.Pratt、J.H.Morris于1977年联合发表。
它的大致思想是每当主串
S
和模式串T
中的字符失配时,利用已匹配的结果,尽可能减少模式串T
的回退位置(next数组),进而降低时间复杂度。
上面说的比较抽象,下面以leetcode上的一道题为例,由浅入深,来具体介绍KMP算法。
28.实现strStr()
-
题目描述:实现
strStr()
函数。给你两个字符串
haystack
和needle
,请你在haystack
字符串中找出needle
字符串出现的第一个位置(下标从 0 开始)。如果不存在,则返回 -1 。说明:当
needle
是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。对于本题而言,当
needle
是空字符串时我们应当返回 0 。这与 C 语言的strstr()
以及 Java 的indexOf()
定义相符。 -
示例
输入:haystack = "hello", needle = "ll" 输出:2 输入:haystack = "aaaaa", needle = "bba" 输出:-1 输入:haystack = "", needle = "" 输出:0
-
分析
这是一道经典的模式匹配问题,下面由浅入深,分别从调用Java API、暴力匹配方式、KMP算法来解决此问题。
-
解法一:直接调用API
class Solution { public int strStr(String haystack, String needle) { return haystack.indexOf(needle); } }
-
解法二:暴力匹配
暴力匹配的思想是挨个遍历主串
haystack
中的字符,判断以该字符开头的子串是否与needle
相等。很容易可以写出如下代码:代码一
class Solution { public int strStr(String haystack, String needle) { // needle为空时直接返回0 if(needle == null || needle.length() == 0) return 0; int m = haystack.length(), n = needle.length(); // 挨个遍历主串`haystack`中的字符 for(int i = 0; i < m - n + 1; i++) { // 将子串haystack(i, i + needle.length() - 1)与needle作比较 if(compare(haystack, needle, i)) { return i; } } return