这个算法是计算关于字符串匹配问题。
求一个字符串在另一个字符串是否存在, 如果存在下标在哪里?
str1 = “abcdefgh”
str2 = “efg”
求str2是否为str1的字串, 很显然可以看出下标为4.
这里我推荐大家看下刘毅大佬的文章, 写得很详细。
大佬KMP算法详解
另一位大佬的KMP解析
我相信大家看完之后,就会有所体会、了解。
这块大佬给我们留下一些猜想, 就是第一次找到了就不会去寻找了, str1字符串中后面或许还有的呢, 我就做一些弥补吧, 也是写这篇文章的原因。
基于大佬给出的思想和代码,其实用心你就会发现很简单的。
str1 = “abcdefghlmngh”
str2 = “gh”
我们可以发现str2在str1中6号下标有一次, 在11下标还有一次。
str1 = “abcdefggggglmngg”
str2 = “gg”
在下标为6、7、8、9 和 14存在。
那么这就是我们更新的。
我直接给源码, 也就是在主KMP算法中做一些调整就可以。
//优化过后的next 数组求法
void GetNextval(string p, vector<int>& next)
{
int p_len = p.size();
int i = 0;
int j = -1;
next[0] = -1;
while (i < p_len) {
if (j == -1 || p[i] == p[j]) {
i++;
j++;
if (p[i] != p[j]) {
next[i] = j;
}
else {
next[i] = next[j];
}
}
else {
j = next[j];
}
}
}
//KMP算法
void KmpSearch(const char* s, const char* p, const vector<int>& next, vector<int>& tmp)
{
int i = 0;
int j = 0;
int sLen = strlen(s);
int pLen = strlen(p);
while (i < sLen) { //如果想要找后续的, 就必须以str1结束为标准
while (i < sLen && j < pLen)
{
//①如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++
if (j == -1 || s[i] == p[j])
{
i++;
j++;
}
else
{
//②如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]
//next[j]即为j所对应的next值
j = next[j];
}
}
if (j == pLen) { //能够出来代表找到了一次,记录下
tmp.push_back(i - j); //存起来
i = i - j + 1; //重新设置i的起点, 在找到的下标加+1
j = 0; //重新设置j的起点, 设置为0
}
else { //一次都没有找到,证明没有,退出
break;
}
}
}
测试结果:
const char* str1 = “abcdefghlmngh”;
const char* str2 = “gh”;
const char* str1 = “abcdefggggglmngg”;
const char* str2 = “gg”;