前言
KMP是一个经典的字符串匹配算法。
然后AC自动机是基于KMP思想的一个多模板匹配算法。
trie图是AC自动机的一个优化。
fail树是AC自动机中fail指针构成的有特殊性质的树。
KMP算法
算法原理
设两个字符串长度为n和m。
两个模板匹配,如果暴力匹配是暴力枚举起点,最坏时间复杂度O(n * m * min(n,m) )
利用一个叫做失配指针的东西,f[i]表示当前字符串中等于当前后缀的前缀。
举个例子:abcdffffabcd,那么最后一个失配指针就是4,因为’abcd’=’abcd’
预处理初这个失配指针,然后就可以在当前失配的时候快速找到第一个可能被配对的元素。
代码
这里的代码有用到我们习惯用1为第一个元素,但是下标开始为0这个性质,一些字符就少了调整的需要,看起来比较简单,但可能理解稍微有点不容易,注意上面提到的这个细节即可。
void get_fail(char *p,int *f)
{
int n=strlen(p),i=0,j=-1;//注意j的初值,j是当前前缀。
f[0]=-1;//这是为了直接失配比较方便转移。
while(i<n)
{
while(j>=0&&p[i]!=p[j])j=fail[j];
i++;j++;
fail[i]=j;
}
}
int KMP(char *p,char *t)
{
get_fail(p,fail);
int n=strlen(p),m=strlen(t);
int i=0,j=0,cnt=0;
while(i<m)
{
while(j>=0&&p[j]!=t[i])j=fail[j];
i++,j++;
if(j==n)cnt++