今天是第8天刷leetcode,立个flag,打卡60天,
算法挑战链接
28. 找出字符串中第一个匹配项的下标https://leetcode.cn/problems/find-the-index-of-the-first-occurrence-in-a-string/
第一想法
题目理解:从一个较长的字符串中找到一个较短的子串,返回匹配的子串的第一个下标。
第一想法就是遍历较长的字符串,找到对应的子串的开头相同的字符,然后截取相同长度的子串,比较是否相同。
用比较正式的话来说就是滑动窗口,先找到第一个匹配的位置,然后在逐个比较。逐个比较的过程我使用了java的字符串的equal方法,因此这一步我是省略了。具体的代码如下
class Solution {
public int strStr(String haystack, String needle) {
//遍历haystack ,如果开头一致,则直接获取字串来对比,如果开头不一致,则丢弃
char startChar = needle.charAt(0);
for (int i = 0; i < haystack.length(); i++) {
if (haystack.charAt(i)==startChar && i+needle.length() <= haystack.length()) {
if (haystack.substring(i, i+needle.length()).equals(needle)) {
return i;
}
}
}
return -1;
}
}
看完代码随想录之后的想法
什么?什么?什么?居然还有KMP算法,这个算法很牛逼。
KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配了。
这个是使用KMP算法来匹配的动画, 应该是可以体现出KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配了。当b和F没有匹配上的时候,并不是从第一个开始匹配,而是从B位置开始匹配。
KMP具体的算法我就不展开细说了,主要是为了勾起大家的兴趣,如果想了解,可以自行去找资料看看。
代码的实现如下:
class Solution {
//前缀表(不减一)Java实现
public int strStr(String haystack, String needle) {
if (needle.length() == 0) return 0;
int[] next = new int[needle.length()];
getNext(next, needle);
int j = 0;
for (int i = 0; i < haystack.length(); i++) {
while (j > 0 && needle.charAt(j) != haystack.charAt(i))
j = next[j - 1];
if (needle.charAt(j) == haystack.charAt(i))
j++;
if (j == needle.length())
return i - needle.length() + 1;
}
return -1;
}
private void getNext(int[] next, String s) {
int j = 0;
next[0] = 0;
for (int i = 1; i < s.length(); i++) {
while (j > 0 && s.charAt(j) != s.charAt(i))
j = next[j - 1];
if (s.charAt(j) == s.charAt(i))
j++;
next[i] = j;
}
}
}
实现过程中遇到哪些困难
理解KMP还是比较好理解的,但是当我去理解如何计算next数组的值的时候,真的好绕。
今日收获
大概明白了如何计算KMP的最大相同前后缀的值,可以构造next数组,帮助我下次做字符串匹配的时候可以更加高效。