KMP学习笔记。
主要还是自己的领悟
嘿嘿
先看主要代码:
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
char s[1000010],ss[11000001];
int p[1100001],ls,lss,ans;
int main()
{
cin>>s+1>>ss+1;
ls=strlen(s+1),lss=strlen(ss+1);
for(int i=1,j=0;i<=lss;i++)
{
while(j>0&&ss[j+1]!=ss[i+1]) j=p[j];
j+=(ss[j+1]==ss[i+1]);
p[i+1]=j;
}
for(int i=1,j=1;i<=ls;i++)
{
while(j>0&&ss[j+1]!=s[i+1]) j=p[j];
j+=(s[i+1]==ss[j+1]);
if(j==lss) ans++,j=p[j];
}
printf("%d",ans);
return 0;
}
那么下面我们开始解释这代码做了啥。
首先它分为两个部分,第一个部分用来求匹配子串的next。
next的定义:next[i]意思为前i位的最长相同前后缀长度,举个例子,比如一个子串c=‘ababc’,那么next[4]=2,ab互相相等嘛,还有就是假如c='ababa’那么这个时候的next[5]=3,由此可见,前后缀是可以重复的。
有这个有啥用?
例如a=‘abababaabab’,b=‘abab’ 那么很显然,当a[8]!=b[4]时,就可已通过next[4]=2,使得b[2]对齐a[7]继续匹配,所以速度快很多,接近O(L)。
然后就是这样,以此类推,第二部分就是不同的子串而已。