28.找出字符串中第一个匹配项的下标
思路:首先定义文本串和模式串,需要在文本串中寻找是否包含模式串。利用KMP算法,先构造出模式串中的前缀表,前缀表的长度与模式串长度相同,对应字符的前缀表的数字,就是当前位置往前的字符串中(包含当前位置),有多大长度的相同前缀后缀。(前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串;后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。)构造完模式串的前缀表,可以与文本串进行匹配。当=字符串长度-1时,说明找到了字符串中第一个完整的匹配项,返回字符串中对应的第一个下标。
class Solution {
public:
void getNext(int *next,string&s)
{
int j =-1;
next[0]=j;
for(int i =1;i<s.size();i++)
{
while(j>=0&&s[i]!=s[j+1])//前后缀不同则回退,最多回退到开头,即j=0
{
j=next[j];//向前回退
}
if(s[i]==s[j+1])
{
j++;//前后缀相同,j++;
}
next[i]=j;//将j付给next[i]
}
}
int strStr(string haystack, string needle) {
if (needle.size()==0)
{
return 0;
}
int next[needle.size()];
getNext(next,needle);
int j=-1; //next数组里记录的初始位置为-1
for(int i=0;i<haystack.size();i++)
{
while(j>=0 && haystack[i]!=needle[j+1])
{
j=next[j];
}
if(haystack[i]==needle[j+1])
{
j++;
}
if(j==needle.size()-1)
{
return (i-needle.size()+1);
}
}
return -1;
}
};
459.重复的子字符串
思路:利用KMP算法,输出字符串的前缀表,如果前缀表的最后一位不等于-1,说明找个字符串中有相同的前后缀,但此时还不能确定是否由重复的子字符串构成,如果是由重复的子字符串构成,那么最小的子字符串一个周期的长度一定为字符串长度减去前缀后缀最长相等长度。如果该长度可以被字符串长度整除,则说明整个数组是这个周期的循环。
class Solution {
public:
void getNext(int*next,string&s)
{
next[0]=-1;
int j =-1;
for(int i = 1;i<s.size();i++)
{
while(j>=0 && s[i]!=s[j+1])
{
j=next[j];
}
if(s[i]==s[j+1])
{
j++;
}
next[i]=j;
}
}
bool repeatedSubstringPattern(string s) {
if(s.size()==0)
{
return false;
}
int next[s.size()];
getNext(next,s);
int len =s.size();
if(next[len-1]!=-1 && len % (len - (next[len - 1] + 1)) == 0 )
{
return true;
}
return false;
}
};
收获:
1、学习了KMP算法,理解了前缀表的作用,遍历数组时,i要从1开始。
2、学习了数组匹配的判断条件,当模式串索引移动了模式串的长度次时,说明在字符串中找到了一个完整的模式串。