简介:
基本思路:在寻找的过程中,文本指针i,并不回退,而是去移动模式指针j的值,那这个移动到哪个位置是去查询next数组(ptr_p=next【ptr_p】)
而next 【i】 实际上是模式字符串里面以下标i-1为尾的子串,它的最长相同前缀和后缀的长度。next数组的构建是通过递推来进行的
理解:左神p542
代码:
void getnext(string pat, vector<int> &next) {
if (pat.size() == 1) {
next[0] = -1;
return;
}
next[0] = -1;
next[1] = 0; // 2个初值
int i = 2; // 当前位置
int cn = next[i - 1];// 上一个位置的next值,也就是会跟pat【i-1】被比较对象的下标位置
while (i < pat.size()) {
if (pat[i - 1] == pat[cn]) {
next[i++] = ++cn;
}
else if (cn > 0) {
cn = next[cn]; // // 不相等 且 cn大于0,因为next[0]=-1也就是还有位置
}
else {
next[i++] = 0; // 不用设置cn 是因为隐含cn等于0了
}
}
return;
}
int KMP(string text, string pat) {
if (text.size() == 0 || pat.size() == 0)
return -1;
vector<int> next(pat.size());
getnext(pat, next);
int ptr_t = 0; // 文本指针
int ptr_p = 0; // 模式指针
int s1 = text.size();
int s2 = pat.size(); // 必须保存这两个值,因为ptr_p可能会是-1,而size()返回的是无符号数,那么接下来的比较就会出错!!!很关键啊
while (ptr_t<s1 && ptr_p<s2 ) {
if (ptr_p == -1 || text[ptr_t] == pat[ptr_p]) { //假如相同or模式指针没退路了,一起前进
++ptr_p;
++ptr_t;
}
else {
ptr_p = next[ptr_p];
}
}
cout << ptr_t << ptr_p << endl;
return ptr_p == pat.size() ? ptr_t - ptr_p : -1; //注意是ptr_t - ptr_p 举例能验证
}