KMP算法

1.什么是KMP?

这是一种字符串匹配的方法,用于检验一个字符串是不是另一个字符串的子串,是的话在哪个位置。比如说”orz“是”orzjyf"的子串。

一般的检验子串的方式就是对于“orzjyf"中的每一个字符位置都进行一次比较,由于通常不需要比较到最后一位,似乎也不是很复杂,但是如果你遇见了一些极其BT的出题人,他就偏偏要你比较到最后一位,比如”oooooooooooooorz"和“oooorz"之类的,那你就不得不用KMP了.....而且还为AC自动机打基础。

2.KMP的思想是什么?

KMP的思想基于一个字:

怎么懒?比如说我要在“abababc"中查找"ababc",我们在查找了"ababa“后发现不匹配,这时候用暴力算法,我们会又从第二个字符”b“开始比对。但是我们就会想,既然"baba"已经比对过了,为什么还要再比对一遍呢?明明可以确定从“b”开始比对是不可能的了。

所以我们需要记录一些东西来保证不进行重复操作。这就是神奇的next数组。

next数组是记录前缀等于后缀的最长长度,举个栗子,还是ababc。

a:0(这是比较特殊的)

ab:0

aba:1(最长等于后缀的前缀是“a")

abab:2(是"ab")

ababc:0

可以发现我们在求下一位的next时不需要从头找起,只需要看一看上一位的next就可以了,还是继续看这个栗子,你在找到第四个字符”b"的时候,你就在上一个“a"的next的下一位比一比,发现是"b",那么next[4]=next[3]+1=2;然后我们看到第5个字符”c",比较next[4]+1,发现是"a"而不是”c",这时候我们寄希望于上一个满足了"ab"的前缀的下一位是"c",所以我们再看一看next[next[4]],可是这时候是0了,那么自然这一位的next值就是0了。

代码实现:

for(j=n2;j>=1;j--)s2[j]=s2[j-1];
    ne[1]=0;
    for(i=1;i<n2;i++){//处理i+1的next
    	x=ne[i];
    	while(1){
    		if(s2[i+1]==s2[x+1]){ne[i+1]=x+1;break;}//找到了
    		else {
    			if(x==0)break;//如果不和第一个相等,要特殊考虑
    			x=ne[x];//如果目前考虑的后缀已经不行了,我们寄希望于将后缀的开头往后挪一个还行,那么此时已经保证了s2[x]=s2[i-1]的,
                                //所以我们再找x的前缀,看一看可不可以。
    		}
    	}
    }

我在第一遍写kmp时为了不写错而把字符串往后总体移动了一位,不移也是可以做的,我就不放代码了。

在匹配的时候如果失配,就顺着next数组继续找就是,可以确定每个字符应该和哪个字符开始比对,代码是这样的:

if(s1[1]==s2[1])f[1]=1;
    for(i=1;i<=n1;i++){
    	x=f[i];
    	if(f[i]==n2)printf("%d\n",i-n2+1);
    	while(1){
    		if(s1[i+1]==s2[x+1]){f[i+1]=x+1;break;}
    		else {
    			if(x==0)break;
    			x=ne[x];
    		}
    	}

3.kmp的题目

其实kmp题目变化比较少......当它和trie树结合起来的时候才是真正恐怖的开始......

uva period:

#include<iostream>
#include<algorithm>
#include<string>
#include<vector>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<queue>
#include<climits>
using namespace std;
int n,cnt=0;
char s1[1000001];
int ne[1000001];
int main()
{
    int i,j,x,kl,kkl,kkkl;
    while(1){
    	cnt++;
    	scanf("%d\n",&n);
    	if(n==0)break;
    	scanf("%s",s1);
    	printf("Test case #%d\n",cnt);
    	ne[1]=0;ne[0]=0;
    	for(i=1;i<n;i++){//字符串时写s1[i-1]
    		x=ne[i];
    		while(1){
    			if(s1[i]==s1[x]){ne[i+1]=x+1;break;}
    			else {
    				if(x==0){ne[i+1]=0;break;}
    				x=ne[x];
    			}
    		}
    	    if(ne[i]*2>=i){
    	    	kl=i-ne[i];
    	    	kkkl=ne[i]-kl;
    	    	if(kkkl%kl==0){
    	    		kkl=i/kl;
    	    		printf("%d %d\n",i,kkl);
    	    		}
    	    }
    	}
    	if(ne[n]*2>=n){
    	    	kl=n-ne[n];
    	    	kkkl=ne[n]-kl;
    	    	if(kkkl%kl==0){
    	    		kkl=n/kl;
    	    		printf("%d %d\n",n,kkl);
    	    		}
    	   }
    	  printf("\n");
    }
    return 0;
}
HDU剪花布条:

#include<iostream>
#include<algorithm>
#include<string>
#include<vector>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<queue>
#include<climits>
using namespace std;
char s1[1005],s2[1005];
int ne[1005];
int main()
{
    int i,j,n1,n2,ans=0;
    while(1){
    	scanf("%s",s1);
    	if(s1[0]=='#')break;
    	scanf("%s",s2);ans=0;
    	n2=strlen(s2);n1=strlen(s1);
    	ne[1]=0;
    	for(i=1;i<n2;i++){//字符是i-1,看向下一个
    		j=ne[i];
    		while(1){
    			if(s2[i]==s2[j]){ne[i+1]=j+1;break;}
    			else {
    				if(j==0){ne[i+1]=0;break;}
    				j=ne[j];
    			}
    		}
    	}
    	j=0;
    	for(i=0;i<n1;i++){
    		while(1){
    			if(s2[j]==s1[i]){
    				j++;break;
    				}
    			else {
    				if(j==0)break;
    				j=ne[j];
    			}
    		}
    		if(j==n2){j=0;ans++;}
    	}
    	printf("%d\n",ans);
    }
    return 0;
}

hdu1686:

#include<iostream>
#include<algorithm>
#include<string>
#include<vector>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<queue>
#include<climits>
using namespace std;
int ne[10005];
char s1[10005],s2[1000005];
int T,n1,n2;
long long ans=0;
int main()
{
    int i,j;
    scanf("%d\n",&T);
    while(T){
    	scanf("%s%s",s1,s2);ans=0;
    	T--;
    	n1=strlen(s1);n2=strlen(s2);
    	ne[0]=0;ne[1]=0;
    	for(i=1;i<n1;i++){
    		j=ne[i];
    		while(1){
    			if(s1[i]==s1[j]){ne[i+1]=j+1;break;}
    			else {
    				if(j==0){ne[i+1]=0;break;}
    				j=ne[j];
    			}
    		}
    	}
    	j=0;
    	for(i=0;i<n2;i++){
    		while(1){
    			if(s2[i]==s1[j]){j++;break;}
    			else {
    				if(j==0)break;
    				j=ne[j];
    			}
    		}
    		if(j==n1)ans++;
    	}
    	printf("%lld\n",ans);
    }
    return 0;
}



评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值