KMP
一、最长前缀、最长后缀
1. 前缀、后缀
概念:前缀,除了最后一个字符以外,一个字符串的全部头部组合;后缀,除了第一个字符以外,一个字符串的全部尾部组合。
eg: str1 = “abcabcd”
- 'a’前缀,后缀为空集,共有元素为0
- 'ab’前缀[a],后缀[b],共有元素为0
- 'abc’前缀[a, ab],后缀[bc, c],共有元素为0
- ‘abca’前缀[a, ab, abc],后缀[bca, ca, a],共有元素为’a’,共有元素长度为1
- ‘abcab’前缀[a, ab, abc, abca],后缀[bcab, cab, ab, b],共有元素为’ab’,共有元素长度为2
- ‘abcabc’前缀[a, ab, abc, abca, abcab],后缀[bcabc, cabc, abc, bc, c],共有元素为’abc’, 共有元素长度为3
- ‘abcabcd’前缀[a, ab, abc, abca, abcab, abcabc],后缀[bcabcd, cabcd, abcd, bcd, cd, d],共有元素为’abc’, 共有元素长度为3
2. 子串、子序列
- 子串是连续的,一个字符串的最大子串是它本身
- 子序列可以连续也可以不连续
3. 最长前缀、最长后缀
最长前缀、最长后缀匹配长度为字符串中某一元素(索引为i)的最长共有元素长度
eg: str2 = “aaaaab”
字符’b’的最长共有元素长度为4
二、 next[]求解
求pat串中每一个字符的最长前缀、最长后缀
注意:
next[0] = -1
next[1] = 0
str1 = “ababac”
next_str1 = [-1, 0, 0, 1, 2, 3]
str2 = “abcabcababaccc”
next_str2 = [-1, 0, 0, 0, 1, 2, 3, 4, 5, 1, 2, 1, 0, 0]
求解pat串的java代码
/*
* 根据pat串获得next[]
* */
public static int[] getNextArray(char[] pat) {
if (pat.length == 1) {
return new int[]{
-1};
}
int[] next = new int[pat