KMP算法
用途
kmp算法通常用于匹配字符串中的目标字符串
暴力做法
思路
暴力做法思路很简单,假设被搜索字符串为a,目标字符串为b,用i表示a中当前进行比较的字符的位置,用j表示当前进行比较的字符的位置。
代码
int violent(string a,string b)
{
int i = 0;
int j = 0;
for(i = 0; i <= a.length()-b.length(); i++)
{
int can = 1;
for (j = 0; j<b.length(); j++)
{
if(b[j]!=a[j+i])
{
can = 0;
break;
}
}
if(can) return i;
}
return -1;
}
KMP算法
优化思路
以搜索字符串 String1 = abababcab 和目标字符串 String2 = ababc为例
用 i 表示搜索字符串的比较字符位,用 j 表示字符串的比较字符位
在进行比较的时候,如果String1[ i ] == String2[ j ],那么比较他们的下一个字符,当比较到String1中的ababa时,我们发现最后一个 'a' 与 String2 中的 'c' 不同
按照暴力搜索的做法,此时j需要归0,从头进行比较
但是....!此时我们发现 'c'前面的 "abab" 和 String1的那个 'a' 前面的 "abab"完全匹配,那么此时我们将j回退两位,此时j前面为 "ab",继续进行比较。
进行回退操作的前提是在该出错字符前存在两个相同的子串,才能跳到前子串重新比较。
目标串回退
次数 | 回退位置 |
---|---|
1 | 0 |
2 | 0 |
3 | 1 |
4 | 2 |
从上面可知,其实就是回退到最长两相同子串的前子串的后一位
next数组的实现
关键问题在于 j 要回退到哪一位,在KMP算法中我们使用一个next数组储存我们的回退位
void GetNext(string b, int next[])
{
long len = b.length();
next[0] = -1;
int j = 0;
int k = -1;
while (j < len - 1)
{
if(k == -1||b[j]==b[k])
{
k++;
j++;
next[j] = k;
}
else k = next[j];
// 回退到前一个最长重复子串的后一位
}
}
查找字符串具体实现
int KMP(string a, string b)
{
GetNext(b, Next);
long i = 0;
long j = 0;
long alen = a.length();
long blen = b.length();
while (i < alen && j < blen)
{
if(j == -1 || a[i] == b[j])
{
i++;
j++;
}
else
{
j = Next[j];
}
}
if(j==blen) return i-j;
// i-j即为此时起始匹配字符的位置
return -1;
// 如果不存在,返回-1
}