http://www.matrix67.com/blog/archives/115
Orz maxtix67
一直拖着到碰到了KMP算法的题才学。。
设有字符串A:abefgababef
模式串 B:abefgabef
当A与B进行匹配时,设i是A上的指针,j是B上的指针,则A和B匹配到第8位就会失配。按照常规方法,我们会将i跳回到2,j跳回到1进行匹配。观察之后我们会发现其实这是多余的,因为中间的befg都是不可能的,我们应该直接跳到A的第6位进行匹配。
KMP算法就是通过过滤这样无用字符来加快匹配速度的。。
以上面的B为例,当abefgab已经被匹配而下一位失配的时候,其实后面的ab可以直接作为新一次匹配的开头利用起来的,因为ab即是abefgab的前缀又是后缀。这为我们提供了思路,我们如果能找到已匹配字符串的最大的即是前缀又是后缀的子串(称它为前后缀好了)我们就可以直接将他放到下一次匹配中,这就减少了时间复杂度。现在的问题是如何求出模式串每一个前缀的最大的前后缀呢。。
令s[i]为模式串的第i个前缀,即前i位构成的串,p[i]为s[i]的最大前后缀长度,假设我们已知p[i],要求p[i+1],其实这是一个模式串的自身匹配过程。如果s[i+1]==s[p[i]+1]也就是最大前后缀作为前缀和作为后缀的下一位匹配上了,显然p[i+1]=p[i]+1;如果不相等,就退而求其次的找p[i]的最大前后缀,这样一直退下去,总有一个会匹配上,否则p[i+1]就为0。这样我们就得到了p数组,匹配的时候可以仿照求p的过程来进行。。
获取p数组:
- void getp()
- {
- j=0;p[0]=0;
- for (i=1;i<m;i++)
- {
- while (j&&b[j]!=b[i]) j=p[j-1];
- if (b[j]==b[i]) j++;
- p[i]=j;
- }
- }
codevs1404:
- #include<iostream>
- #include<cstdio>
- #include<memory.h>
- #define maxn 200005
- char a[maxn],b[maxn];
- int i,j,n,m,k,x,p[maxn],len[maxn],cnt[maxn];
- void getp()
- {
- j=0;p[0]=0;
- for (i=1;i<m;i++)
- {
- while (j&&b[j]!=b[i]) j=p[j-1];
- if (b[j]==b[i]) j++;
- p[i]=j;
- }
- }
- void match(char *a,char *b)
- {
- int i,j=0;
- for (i=0;i<n;i++)
- {
- while (j&&b[j]!=a[i]) j=p[j-1];
- if (b[j]==a[i]) j++;
- cnt[j]++;
- if (j==m) j=p[j-1];
- }
- }
- int main()
- {
- scanf("%d%d%d\n%s\n%s",&n,&m,&k,&a,&b);
- getp();
- memset(cnt,0,sizeof(cnt));
- match(a,b);
- for (i=m;i>=1;i--) cnt[p[i-1]]+=cnt[i];
- for (i=1;i<=k;i++)
- {
- scanf("%d",&x);
- printf("%d\n",cnt[x]-cnt[x+1]);
- }
- }