题目:
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。
输入:haystack = "sadbutsad", needle = "sad"
输出:0
解释:"sad" 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。
输入:haystack = "leetcode", needle = "leeto"
输出:-1
解释:"leeto" 没有在 "leetcode" 中出现,所以返回 -1 。
输入:haystack = "mississippi", needle = "issip"
输出:4
查找A字符串中的B字符串是否出现,就可以采用KMP算法。那么KMP算法核心就是计算B字符串的前缀表,用来和A对比时进行回退比较指针。
先给出计算next数组的流程:
1.初始化
2.最大前缀!=最大后缀
3.最大前缀==最大后缀
4.更新next数组
void getNext(vector<int> &next, string needle)
{
int j(0),i; // j指向前缀末尾位置,i指向后缀末尾位置
for(int i(1); i < needle.size(); i++)
{
while(needle[i] != needle[j] && j>0) // 前缀 != 后缀(或许会不止一次的不相等,要用while)
{
j = next[j-1]; //用next数组回退j指向的位置
}
if(needle[i] == needle[j]) //前缀 == 后缀
{
j++;
}
next[i] = j; //更新next
}
}
int strStr(string haystack, string needle) {
vector<int> v(needle.size(), 0); // 初始化next数组。
getNext(v, needle); //得到needle的前缀表
int i_h(0), i_n(0); //指向haystack和needle的坐标。
for(;i_h < haystack.size() && i_n < needle.size();i_h++)
{
if(haystack[i_h] == needle[i_n]) // 坐标指向的字符相等
{
if(i_n == needle.size()-1) // needle的坐标已经到达尾部,说明匹配到了
{
return i_h-needle.size()+1; // 此处可以根据不同题目返回不同格式答案
}
i_n++; // 未到达尾部,需要把needle的坐标往后移动一位,匹配下个字符
}
else
{
if(i_n > 0) // 保证next数组不越界
{
i_n = v[i_n-1]; //回溯
i_h--; //由于i_h每个for循环会自动++,但是本次循环在做needle的回溯
//要让i_h--,然后for循环内++。从而使得i_h能保持不动,持续回溯needle
}
}
}
return -1;
}
通过本题学会了KMP算法,前缀表的算法,以及如何使用KMP去解决在A中寻找是否存在B的问题。