-
KMP算法
主要思想:
当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配。
前缀表(next数组):
用来回退,记录模式串与主串不匹配时,模式串应从哪里开始重新匹配。记录下标i(包括i)的字符中,有多大长度的相同前后缀。
前缀:不包括最后一个字符的所有以第一个字符开头的连续子串。
后缀:不包含第一个字符的所有以最后一个字符结尾的连续子串。
构造next数组(整体-1):
1)初始化:
定义两个指针,j指向前缀末尾,i指向后缀末尾。
next[i]为i(包括i)之前的最长相等前后缀长度。
int j = -1;
next[0] = j;
2)处理前后缀不相等的情况。
s[i]与s[j+1]不相等,需找到j在next数组里的值next[j]。
3)处理前后缀相等情况。
s[i]与s[j+1]相等,同时向后移动i和j,说明找到相同的前后缀,同时需要将j的长度赋值给next[i]。
void getNext(int* next, const string& s){
int j = -1;
next[0] = j;
for(int i = 1; i < s.size(); i++) { // 注意i从1开始
while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
j = next[j]; // 向前回退
}
if (s[i] == s[j + 1]) { // 找到相同的前后缀
j++;
}
next[i] = j; // 将j(前缀的长度)赋给next[i]
}
}
得到next数组后,用其做匹配。
28.实现strStr()
实现 strStr() 函数。
给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回 -1。
class Solution {
public:
void getNext(int* next,string& s) {
int j=-1;
next[0]=j;
for(int i=1;i<s.size();i++) {
while(j>=0&&s[i]!=s[j+1]) {
j=next[j];
}
if(s[i]==s[j+1]) {
j++;
}
next[i]=j;
}
}
int strStr(string haystack, string needle) {
if(needle.size()==0) return 0;
int next[needle.size()];
getNext(next,needle);
int j=-1;
for(int i=0;i<haystack.size();i++) {
while(j>=0&&haystack[i]!=needle[j+1]) {
j=next[j];
}
if(haystack[i]==needle[j+1]) {
j++;
}
if(j==(needle.size()-1)) {
return (i-needle.size()+1);
}
}
return -1;
}
};
459.重复的字符串
给定一个非空的字符串,判断它是否可以由它的一个子串重复多次构成。给定的字符串只含有小写英文字母,并且长度不超过10000。
移动匹配法:
当一个字符串内部由重复的字符串组成,则字符串的结构一定是由前后相同的子串组成。
则可建立s+s构成新的字符串,后面的子串做前串,前面的子串做后串,还可构成一个s。
例如:
因此,只要s是由重复子串组成,拼接在一起则可找到s,但需除去s+s的开头与结尾。
class Solution {
public:
bool repeatedSubstringPattern(string s) {
string t=s+s;
t.erase(t.begin());
t.erase(t.end()-1);
if(t.find(s)!=std::string::npos) return true;
else return false;
}
};
(std::string::npos表示不存在的位置)