KMP算法学习笔记

http://www.matrix67.com/blog/archives/115

Orz maxtix67

一直拖着到碰到了KMP算法的题才学。。

设有字符串A:abefgababef

        模式串 B:abefgabef

当A与B进行匹配时,设i是A上的指针,j是B上的指针,则A和B匹配到第8位就会失配。按照常规方法,我们会将i跳回到2,j跳回到1进行匹配。观察之后我们会发现其实这是多余的,因为中间的befg都是不可能的,我们应该直接跳到A的第6位进行匹配。

KMP算法就是通过过滤这样无用字符来加快匹配速度的。。

以上面的B为例,当abefgab已经被匹配而下一位失配的时候,其实后面的ab可以直接作为新一次匹配的开头利用起来的,因为ab即是abefgab的前缀又是后缀。这为我们提供了思路,我们如果能找到已匹配字符串的最大的即是前缀又是后缀的子串(称它为前后缀好了)我们就可以直接将他放到下一次匹配中,这就减少了时间复杂度。现在的问题是如何求出模式串每一个前缀的最大的前后缀呢。。

令s[i]为模式串的第i个前缀,即前i位构成的串,p[i]为s[i]的最大前后缀长度,假设我们已知p[i],要求p[i+1],其实这是一个模式串的自身匹配过程。如果s[i+1]==s[p[i]+1]也就是最大前后缀作为前缀和作为后缀的下一位匹配上了,显然p[i+1]=p[i]+1;如果不相等,就退而求其次的找p[i]的最大前后缀,这样一直退下去,总有一个会匹配上,否则p[i+1]就为0。这样我们就得到了p数组,匹配的时候可以仿照求p的过程来进行。。

获取p数组:

void getp()
{
	j=0;p[0]=0;
	for (i=1;i<m;i++)
	{
		while (j&&b[j]!=b[i]) j=p[j-1];
		if (b[j]==b[i]) j++;
		p[i]=j;
	}
}
codevs1404:

#include<iostream>
#include<cstdio>
#include<memory.h>
#define maxn 200005
char a[maxn],b[maxn];
int i,j,n,m,k,x,p[maxn],len[maxn],cnt[maxn];
void getp()
{
	j=0;p[0]=0;
	for (i=1;i<m;i++)
	{
		while (j&&b[j]!=b[i]) j=p[j-1];
		if (b[j]==b[i]) j++;
		p[i]=j;
	}
}
void match(char *a,char *b)
{
	int i,j=0;
	for (i=0;i<n;i++)
	{
		while (j&&b[j]!=a[i]) j=p[j-1];
		if (b[j]==a[i]) j++;
		cnt[j]++;
		if (j==m) j=p[j-1];
	}
}
int main()
{
	scanf("%d%d%d\n%s\n%s",&n,&m,&k,&a,&b);
	getp();
	memset(cnt,0,sizeof(cnt));
	match(a,b);
	for (i=m;i>=1;i--) cnt[p[i-1]]+=cnt[i];
	for (i=1;i<=k;i++)
	{
		scanf("%d",&x);
		printf("%d\n",cnt[x]-cnt[x+1]);
	}
}



  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值