- 基本场景
- 核心思想
- 扩展加深
基本概念
KMP算法用于字符串的匹配,假定现在需要在s1中查找s2,暴力解就是直接去遍历查看是否匹配,显然这样的时间复杂度显然是O(MN)的,而字符串通过引入前缀串和后缀串的信息,来进行一个匹配上的加速。个人觉得优秀的算法就是对已经获取的信息减少后续的重复获取,下面就让我们进入KMP算法的核心思想去体会如何有效利用已经获取的信息。
核心思想
- 前缀串后缀串
用一个next数组存储前缀串和后缀串的最大长度 求法看下图
//next数组求法图
- 为何next数组加速
显然我们需要next数组的信息为我们加速,具体理解过程看图呗 ^v^
//利用next数组加速图
//为何这样加速图
- 代码演示
如果上述你没有理解,那就先放下,看代码,同样会有代码的图解,然后结合上述理解
int MyKmp(string s1,string s2) {
if( s2.size()>s1.size() ) return -1;
int arr[s2.size()];
GetNextArray( s2,arr,sizeof(arr)/sizeof(arr[0]) );
int i=0,j=0;
while( i<s1.size()&&j<s2.size() ) {
if( s1[i]==s2[j] ) { //大家都加加
i++;
j++;
}
else if( next[j]>0 ) //不相等 但是存在s1的后缀与s2的前缀相等(部分相等)
j = next[j];
else { //大家完全不等
i++
j = 0;
}
}
return j==s2.siize()?i-j:-1;
}
//代码图解
备注:当当前字符不存在前缀串和后缀串相等时,那么这段区间显然不会相等
- next数组的求法
void GetMaxArray(string s,int* next,int size) {
if( size==1 ) {
next[0] = -1;
return;
}
next[0] = -1;
next[1] = 0;
int cn = 0,cur = 2;
while( cur<size ) {
if( s[cur]-1==s[cn] )
next[cur++] = ++cn;
else if( next[cn]>0 )
cn = next[cn];
else
next[cur++] = 0;
}
}
//next数组
next数组这样求取是因为 到达新的位置时 利用前面已有的字符串前后缀信息 看能否追加上去
扩展加深
- 利用已有字符串向后添加字符,最终生成的字符串包含两个原始串,两个原始串开始位置不一样,求这样的最短串
eg: abcabc
添加后:abcabcabc
思路:算出整体串的最长前缀和最长后缀,追加中间的部分
显然时next数组的应用,KMP算法的核心就是next数组。