不知道该怎么解释kmp算法,我的解释肯定也不专业以及清晰,因此,在初步了解kmp算法之后,再通过这道题及其注释 来更好理解kmp吧
实现 strStr()
由kmp可知,我们在解决此类题时,需要两个大步骤,
第一步是 找到needle的next数组
next数组,即needle字符串中,每个字母所对应的最长前后缀长度
第二步是 在haystack字符串 和 needle字符串中,分别用 i,j指向它们,一个一个比较是否相同
如图所示:
若两个字母不同,则用前面求的next数组找到j回溯的位置,eg:当i指向’T’,j指向’Y’,此时,需要让j回溯next[7]=2的位置,如图所示
若字母相同 则i,j 都向后移一位
若在比较第一个字母的时候就不一样,则 需要将haystack中的i向后移一位,j不动(意思上是不动,代码不是这样写)
以下是AC代码
class Solution
{
public:
int strStr(string haystack, string needle)
{
if(needle.size() == 0)
return 0;
int i = -1, j = 0;
vector<int> next(needle.size(),0);
next[0] = -1;
//第一部分 next
while(j < needle.size() - 1)
{
//j是指向needle中的字符,固定住,再与i指向的字符比较
//i也是指向needle中的字符,但是若与j指向的不相同,则会回溯到第一个
if(i < 0 || needle[i] == needle[j])//i<0表示从needle头开始找最长前后缀
{
j++;
i++;
next[j] = i;
}//若前面几个字符都不匹配,会发现i在0和1之间不停转变
//不匹配,则j就向下一个移动
else
i = next[i];//若不匹配,则将i回溯到第一个字符
}
//第二部分 开始比较
int n = haystack.size();
int m = needle.size();
//string.size() 返回值的类型是unsigned long
//所以必须调用新变量 才能在后面与 i,j(signed int)进行比较
i = 0, j = 0;
while(i < n && j < m)
{
if(j < 0 || haystack[i] == needle[j])//j<0表示从needle的第一个字符进行比较
{
i++;
j++;
}
else
j = next[j]; //比较不相同 则将j回溯到前缀后第一个字符的位置
}
if( j == m)
return i-j; //j为needle的长度 i-j则为在haystack中 needle第一次出现的位置
return -1;
}
};
关于以下代码的意义
int n = haystack.size();
int m = needle.size();
string.size() 返回值的类型是 unsigned long
数据类型不同,int和unsigned long直接比较会出问题
eg:
int a = -1;
unsigned int b = 1;
//现在比较 a 与 b的大小
int 型与unsigned int 型在自己没有进行强制转换的情况下进行比较。int类型在linux下默认强制转换为unsigned int类型进行比较,所以a与b比较的时候,a会自动转换成unsigned int类型进行比较。由于signed int的符号位最高位是1,转换成unsigned int之后,就会变成一个很大的unsigned int型正数
//下面是题外话
数组与字符串 完结撒花~