一、题目描述:
实现 strStr() 函数。
给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串出现的第一个位置(下标从 0 开始)。如果不存在,则返回 -1 。
说明:
当 needle 是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。
对于本题而言,当 needle 是空字符串时我们应当返回 0 。这与 C 语言的 strstr() 以及 Java 的 indexOf() 定义相符。
示例 1:
输入:haystack = "hello", needle = "ll"
输出:2
示例 2:
输入:haystack = "aaaaa", needle = "bba"
输出:-1
示例 3:
输入:haystack = "", needle = ""
输出:0
二、实现思路:
暴力法当然可以实现,这里就不讲解暴力法了,主要通过这道题讲一下KMP算法,KMP算法是发明这个算法的三个人的首字母来表示的,主要解决字符串匹配问题,暴力搜索中,是两层for循环,一个字符一个字符进行比对,如果不匹配,就重新匹配,KMP算法而是找到之前已经匹配好的最长的地方继续进行匹配。
怎么找到之前匹配好的位置在哪里呢?
其实就是找到这个字符前面的所有字符的最长相等前后缀的长度,比如一个字符串,aabaaf
a:最长前后缀长度为0。
aa:为1。
aab:为0。
aaba:为1。
aabaa:为2。
aabaaf:为0。
所以它的前缀表为 0,1,0,1,2,0。
什么意思呢,当字符不匹配的时候,寻找之前已经匹配好的地方,而前缀表就是储存之前已经匹配好的地方在哪里,比如在字符串 aabaabaaf寻找aabaaf的位置,当匹配到f的时候,f字符与b字符不相等,暴力解法是i++,然后j为0重新进行匹配,但是我们可以在前缀表中找到之前已经匹配好的位置,f字符前一个字符对应的最长相等前后缀的长度为2,也就是说已经匹配好的位置是2,直接从下标为2的字符继续匹配就好了。一般用next数组储存前缀表的值。
三、代码(注释已经很详细了)
class Solution {
public:
int strStr(string haystack, string needle) {
if(needle.length()==0){
return 0;
}
int next[needle.length()];
getNext(next,needle);
//j指向needle下标
int j=0;
//遍历haystack字符串
for(int i=0;i<haystack.length();i++){
//第一种情况,不匹配,返回到之前已经匹配的最长的地方
while(j>0 && needle[j]!=haystack[i]){
j=next[j-1];
}
//第二种情况,正在匹配中,但是还没完全匹配
if(needle[j]==haystack[i]){
j++;
}
//匹配完成
if(j==needle.length()){
return (i-j+1);
}
}
return -1;
}
//next数组就是该字符前面所有字符的最长相等前后缀长度
void getNext(int* next,string s){
//j其实就是最长相等前后缀的长度
int j=0;
//初始化,第一个字符的最长前后缀长度为0
next[0]=0;
for(int i=1;i<s.length();i++){
//第一种,不相等的情况
while(j>0 && s[j]!=s[i]){
//进行回退,找到之前已经匹配好的地方
j=next[j-1];
}
//第二种,相等的情况
if(s[j]==s[i]){
j++;
}
next[i]=j;
}
}
};
主要还是理解回退吧,就是找到之前已经匹配好的位置在哪里。