记得以前刚刚开始学ACM的时候,经常遇到那种处理字符串的题,每次都是傻乎乎的进行暴力模拟,事后还对那些没做出来的同学予以嘲讽"暴力模拟都不会?",现在想想,当时的题数据都太弱,要是稍微数据强点的话就会TLE,自己以最笨的方法做出来的还去嘲笑别人……言归正传,KMP算法是一种很机智,很经典的方法,在我们不知道这个算法的时候(就像我刚刚开始学ACM的时候一样),遇到这种判断一个字符串里是否包含另一个模板串的时候,我们往往都是一个一个进行比较,如果当比到出现不一样的时候,就移一位,在进行比较,当然这种方法肯定不是最优的,仔细想想,比如我们的模板串是ABCDEFG,要比较的是ABCDEFHI……的时候我们在比到G的时候不再一样,这个时候其实我们已经得到了一个信息,那就是前面的都是ABCDEF,而KMP算法就是运用了这一个信息,进行跳转。
这里小编以一个输入母串和模板串,输出在母串中找到的与模板串相同的的子串的开头索引的例子给出小编的KMP算法模板。
#include <cstdio>
#include <cstring>
#include <iostream>
int a[1000000+10],b[10000+10];
int nex[10000+10];
int n,m;
void getNext()
{
int j,k;
j = 0,k = -1;
nex[0] = -1;
while(j < m)
{
if(k == -1 || b[j] == b[k])
nex[++j] = ++k;
else k = nex[k];
}
}
int KMP_Index()
{
int i=0, j=0;
getNext();
while(i<n && j<m)
{
if(j == -1 || a[i] == b[j])
i++,j++;
else j = nex[j];
}
if(j == m) return i-m+1;
else return -1;
}
int main()
{
int T;
scanf("%d",&T);
while(T--)
{
scanf("%d%d",&n,&m);
for(int i=0; i<n; i++)
scanf("%d",&a[i]);
for(int i=0; i<m; i++)
scanf("%d",&b[i]);
printf("%d\n",KMP_Index());
}
return 0;
}