KMP算法
介绍
- KMP主要应用在字符串匹配上
- KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配了
- 所以如何记录已经匹配的文本内容,是KMP的重点,也是next数组的作用
前缀表的求法
参考此视频结合图示理解
原理篇:https://www.bilibili.com/video/BV1PD4y1o7nd/?spm_id_from=333.788&vd_source=7aaca833504124307819810a986fc5e6
/**
* 求前缀表(不减一)
* @param s
* @param next
*/
void getNext(String s, int[] next) {
//初始化
next[0] = 0;
int j = 0;
for (int i = 1; i < s.length(); i++) {
//不相等的情况
while (j > 0 && s.charAt(j) != s.charAt(i)) {
j = next[j - 1];
}
//相等时
if (s.charAt(j) == s.charAt(i)) {
j++;
}
next[i] = j;
}
}
题目描述
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。
示例 1:
输入:haystack = "sadbutsad", needle = "sad"
输出:0
解释:"sad" 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。
示例 2:
输入:haystack = "leetcode", needle = "leeto"
输出:-1
解释:"leeto" 没有在 "leetcode" 中出现,所以返回 -1 。
提示:
- 1 < = h a y s t a c k . l e n g t h , n e e d l e . l e n g t h < = 1 0 4 1 <= haystack.length, needle.length <= 10^4 1<=haystack.length,needle.length<=104
- haystack 和 needle 仅由小写英文字符组成
思路
- 在文本串s里找是否出现过模式串t
- 定义两个下标,j 指向模式串起始位置,i指向文本串起始位置
- i就从0开始,遍历文本串
- 接下来就是
s[i]
与t[j]
进行比较。如果s[i]
与t[j]
不相同,j就要从next数组里寻找下一个匹配的位置。 - 如何判断在文本串s里出现了模式串t呢,如果j指向了模式串t的末尾,那么就说明模式串t完全匹配文本串s里的某个子串了。
代码实现
class Solution {
public int strStr(String haystack, String needle) {
int[] next = new int[needle.length()];
getNext(needle,next);
int j = 0;
for (int i = 0; i < haystack.length(); i++) {
while (j > 0 && haystack.charAt(i) != needle.charAt(j)) {
j = next[j - 1];
}
if (haystack.charAt(i) == needle.charAt(j)) {
j++;
}
if (j == needle.length()) {
return i - j + 1;
}
}
return -1;
}
/**
* 求前缀表(不减一)
* @param s
* @param next
*/
void getNext(String s, int[] next) {
//初始化
next[0] = 0;
int j = 0;
for (int i = 1; i < s.length(); i++) {
//不相等的情况
while (j > 0 && s.charAt(j) != s.charAt(i)) {
j = next[j - 1];
}
//相等时
if (s.charAt(j) == s.charAt(i)) {
j++;
}
next[i] = j;
}
}
}