记一种方便理解的KMP算法理解
next数组 下表为i存储的元素是 【0—i】的字符串最长相同前后缀长度-1。
每次计算下标为i的元素时 【0—i-1】已经计算出,此时利用之前的信息来求当前项。
当求第i的元素,有两种情况:
第一种情况
如果模式串中下标为i的元素 等于 (下标从 0 到 i-1 的模式串的最长公共前后缀的之后紧跟的那个元素),那么next[i] = next[i-1] + 1 ,那么我们如果找到这个紧跟的元素呢?
通过已经求出的next[i-1]中所存储的元素就可以得到。(注意next[i-1]所存储的是【0 — i-1】的字符串最长相同前后缀长度-1,把这个信息换成坐标并找到那个紧跟的元素就好了)
第二种情况
如果不等于怎么办?
我们要明白这样一件事:
设下标【0 ---- i-1】的 字符串的最长公共前后缀为s1 和 s2。
之后设前缀字符串s1的最长公共前后缀为s3和s4。
那么s3和s4也必然是下标【0 ---- i-1】的 字符串的公共前后缀,只不过他们不是最长的(比s1和s2短)。
这个时候我们只需要把对【0 ---- i-1】的字符串操作 变为对s1的操作,之后就变成的s1的前缀s3后那个元素和str【i】元素的比较。 之后又是面临的第一种和第二种情况,如此迭代就好了
第一种在next[i-1]的基础上+1:
分析:
vector<int>& getNext(string str){
vector<int>* next = new vector<int>(str.length(),-1);
// 处理边界值
if(str.length() == 1){
return *next;
}
//每次求下标为i的next数组元素时,此时【0---- i-1 】的next数组已经求出
//我们采取已经求出的信息来求i的next数组
for(int i = 1; i < next->size(); i++){
int j = next->at(i-1);
while (j != -1 && str[j+1] != str[i])
{
j = next->at(j);
}
if(str[j+1] == str[i]){
next->at(i) = j+1;
}
// else{
// //因为一开始的时候next被初始化为全部为-1 所以这个else分支可以省略
// next[i] = -1;
// }
}
return *next;
}