题目描述
找出字符串中第一个匹配的下标
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。
解法一
采用暴力解法
//bf算法
char[] t = haystack.toCharArray();
char[] s = needle.toCharArray();
int p = 0,len1 = t.length,len2 = s.length;
//主串没有寻找一遍,防止数组越界
while (p<len1 && p+len2<=len1) {
//找到第一个匹配的元素
if (t[p]==s[0]) {
int count = 1; //计数器,统计匹配次数,初始为1,第一个已经匹配了
//遍历s后续元素是否也匹配,故下标从1开始
for (int i=1;i<len2;i++) {
if (t[p+i]==s[i]) {
count++;
}
}
//判断是否完全匹配
if (count==len2) {
return p;
}
}
//主串指针后移1位
p++;
}
return -1;
解法二
采用KMP
首先要了解,前缀 和 后缀
- "前缀"指除了最后一个字符以外,一个字符串的全部头部组合;
- "后缀"指除了第一个字符以外,一个字符串的全部尾部组合。
下面以”aabaaf”为例,进行介绍:
- ”a”的前缀和后缀都为空集,最长共有元素的长度为0;
- ”aa”的前缀为[a],后缀为[a],最长共有元素的长度为1;
- ”aab”的前缀为[a, aa],后缀为[ab, b],最长共有元素的长度0;
- ”aaba”的前缀为[a, aa, aab],后缀为[aba, ba, a],最长共有元素的长度为1;
- ”aabaa”的前缀为[a, aa, aab, aaba],后缀为[abaa, baa, aa, a],,a和aa都是其共有元素,最长共有元素为”aa”,长度为2;
- ”aabaaf”的前缀为[a, aa, aab, aaba, aabaa],后缀为[abaaf, baaf, aaf, af, f],没有共有元素,长度为0;
因此我们上述最长共有元素进行组合便可以得到Next数组。
Next = [0, 1, 0, 1, 2, 0]
【Next数组代码解法】
public static int[] getNext(String needle) {
int[] next = new int[needle.length()];
int j = 0;
for (int i = 1; i < next.length; i++) {
while (j > 0 && needle.charAt(j) != needle.charAt(i))
j = next[j - 1];
if (needle.charAt(j) == needle.charAt(i)) {
j++;
}
next[i] = j;
}
return next;
}
【图解】
因此我们便可以根据Next数组进行KMP配对了。
public static int strStr(String haystack, String needle) {
if (needle.length() == 0) {
return 0;
}
int[] next = getNext(needle);
// 1.i 指向 haystack的元素,j指向needle中的元素
int j = 0;
for (int i = 0; i < haystack.length(); i++) {
// 2.2回退
while (j > 0 && needle.charAt(j) != haystack.charAt(i)) {
j = next[j - 1];
}
// 2.1一个元素匹配成功,j进行前进
if (needle.charAt(j) == haystack.charAt(i)) {
j++;
}
// 3.全部元素匹配成功,直接返回。
if (j == needle.length()) {
return i - j + 1;
}
}
// 4.没有配对成功则返回-1;
return -1;
}