来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/implement-strstr
实现 strStr() 函数。
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串出现的第一个位置(下标从0 开始)。如果不存在,则返回 -1 。
说明:当 needle 是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。
对于本题而言,当 needle 是空字符串时我们应当返回 0 。这与 C 语言的 strstr() 以及 Java 的 indexOf()定义相符。
示例 1:输入:haystack = “hello”, needle = “ll”
输出:2
示例 2:输入:haystack = “aaaaa”, needle = “bba”
输出:-1
示例 3:输入:haystack = “”, needle = “”
输出:0
提示:0 <= haystack.length, needle.length <= 5 * 104
haystack 和 needle仅由小写英文字符组成
这道题其实就是KMP的模板题,用来学习KMP算法。关于KMP算法的介绍这里我就不写了,可以看参考文章,我觉得已经写的很明白了。
关于前缀表和next数组:
前缀表:记录下标 i 之前(包括 i )的字符串中,有多大长度的相同前缀后缀,因此记录的是长度
next数组:参考文章里说,next数组可以是前缀表,但是很多实现都是把前缀表统一减一(右移一位,初始位置为-1)之后作为next数组,这并不涉及到KMP的原理,而是具体实现,next数组既可以就是前缀表,也可以是前缀表统一减一(右移一位,初始位置为-1)。
但是我这里要补充的是为什么我考虑使用前缀表统一减一的方式来表示next数组:
其实我一开始也是考虑直接使用前缀表作为next数组,但是发现写起来很不连贯,有点绕。如果next数组的值与前缀表相同,那么next数组表示的是相同前缀后缀的长度,这时候在代码中 j 的初始值为0,j 表示的含义一会儿体现为相同前缀后缀的长度,一会儿表示needle中当前匹配的字符的下标,不够直观
后来我发现,如果next数组的值为前缀表统一减一,这时候 j 的初始值为-1,在这个过程当中,j 始终可以表示为当前在needle中已匹配的字符的下标,写起来思路明朗了很多
本题Java代码:
class Solution {
public int strStr(String haystack, String needle) {
if (needle.length() == 0)
return 0;
int[] next = getNext(needle);
int j = -1;
for (int i = 0; i < haystack.length(); i++) {
while (j >= 0 && haystack.charAt(i) != needle.charAt(j + 1)) {
j = next[j];
}
if (haystack.charAt(i) == needle.charAt(j + 1))
j++;
if (j == needle.length() - 1)
return i - needle.length() + 1;
}
return -1;
}
private int[] getNext(String needle) {
int j = -1;
int[] next = new int[needle.length()];
next[0] = j;
for (int i = 1; i < needle.length(); i++) {
while (j >= 0 && needle.charAt(i) != needle.charAt(j + 1)) {
j = next[j];
}
if (needle.charAt(i) == needle.charAt(j + 1))
j++;
next[i] = j;
}
return next;
}
}