扩展KMP

扩展KMP算法是用来求txt串每一个后缀与pat的最长公共前缀。
举个例子: txt: aaaaba  pat: aaaa
那么求出的extend[1]=4; extend[2]=3; extend[3]=2; extend[4]=1; extend[5]=0; extned[6]=1;
那么我们第一次的是需要算出来的。第二次呢?
因为t[1,4]=p[1,4],t[2,4]=p[2,4] 这个时候我们需要知道t[2,4]和t[1,3]是否是相等的?如果相等,那么继续往后判断就好,否则就是nxt[2]的长度。所以我们就需要对pat求一个nxt数组。保存pat的每一个后缀和pat自己的最长公共前缀,实际上也是做一个扩展KMP。
现在我们假设extend[1..k]已经算出,匹配过程中最远的匹配位置为p,开始的位置为a。我们知道txt[a,p]=pat[1,p-a+1]->txt[k+1,p]=pat[k+2-a,p-a+1]。我们另l=nxt[k+2-1].
那么现在分两种情况:
l+k<p
那么extend[k+1]=l
否则
我们就需要从txt[p+1]和pat[p-k+1]开始往后判断,直到失配,然后更新a和p的值
模板代码:
void getNxt(char *p)//求nxt数组实际上就是自己和自己做kmp 
{
int len=strlen(p);
nxt[0]=len;
int j=0;
while(j+1<len&&p[j]==p[j+1])
 j++;
nxt[1]=j;
int k=1;
for(int i=2;i<len;i++)
{
int pos=nxt[k]+k-1;
int l=nxt[i-k];
if(l+i<pos+1)
 nxt[i]=l;
else
{
j=max(0,pos-i+1);
while(i+j<len&&p[i+j]==p[j])
 j++;
nxt[i]=j;
k=i;
}
}
}
void e_kmp(char *p,char *t)
{
int plen=strlen(p);
int tlen=strlen(t);
int j=0;
while(j<plen&&j<tlen&&p[j]==t[j])
 j++;
extend[0]=j;
int k=0;
for(int i=1;i<tlen;i++)
{
int pos=extend[k]+k-1;
int l=nxt[i-k];
if(i+l<pos+1)
 extend[i]=l;
else
{
j=max(0,pos-i+1);
while(i+j<tlen&&j<plen&&t[i+j]==p[j])
 j++;
extend[i]=j;
k=i;
}
}
}


 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值