【怪物】KMP畸形变种——扩展KMP

最新推荐文章于 2020-04-14 17:25:53 发布

hi微波炉

最新推荐文章于 2020-04-14 17:25:53 发布

阅读量430

点赞数 1

分类专栏： ----信息学---- ★笔记★ 文章标签：字符串扩展KMP 怪物

本文链接：https://blog.csdn.net/hiweibolu/article/details/53489545

版权

----信息学---- 同时被 2 个专栏收录

148 篇文章 0 订阅

订阅专栏

★笔记★

5 篇文章 0 订阅

订阅专栏

问题

参考51nod1304这道题；
很显然我们要求的是S的每个后缀与S的最长公共前缀的长度之和。

暴力

假设我们把next[i]表示为第i个后缀与S的最长公共前缀的长度。
现在我们想了：这个next数组，如果暴力来求的话，时间复杂度是 $O(n^2)$ 。
这是我们回忆一下KMP：KMP物尽其用，然后呢就把求fail的速度提高到了 $O(n)$ 。
那么我们在求next数组的时候，可不可以也使用这样的想法来物尽其用，尽可能地去除重复的匹配呢？
答案是肯定的。

引入扩展KMP

假设要处理出S的next数组，现在已经处理出前s的next了。
现在要求出下一个位置x的next。
其中维护一个li，使得 $li=max\{next[id]\}(id∈[1,s])$ 。

由next[id]的定义，我们知道 $S[id..li]=S[1..next[id]]$ 。
推得 $S[x..li]=S[1+x-id..next[id]]$ 。
如果 $id>1$ ，那么 $1+x-id<x$ ，进一步 $next[1+x-id]$ 我们已经是知道的了。
于是就有 $S[x..li]=S[1..next[1+x-id]]$ 。

目前为止，我们很容易看出，x往后的 $next[1+x-id]$ 这一段是可以不用匹配的。
但我们需要再分类一下：

1.x+next[1+x-id]-1<li

这种情况显然是 $next[x]=next[1+x-id]$ 。
因为在li范围内， $next[1+x-id]$ 是极大的。
所以 $next[x]$ 不会比 $next[1+x-id]$ 更大。

2.x+next[1+x-id]-1>=li

这种情况虽然我们可以知道，[x,li]这一段是可以不用匹配的。
但是li以后的情况我们都是未知的。
那么我们暴力匹配来推进li。
于是乎就会有新的 $li=next[x],id=x$ 。

重复上述过程，我们可以求出所有的next。
显然时间复杂度只与li的推进有关，即为 $O(n)$ 。

回到本题

使用扩展KMP求出next后，求和即可。
我的博客。

扩展KMP的完全体

事实上本题只是扩展KMP的退化。
扩展KMP可以用于求一个串S的所有后缀与目标串T的最长公共前缀的的长度。
想法与求next数组一样。

设要求的东西叫ext。

其中维护一个li，使得 $li=max\{ext[id]\}(id∈[1,s])$ 。
同理推得 $S[x..li]=T[1..next[1+x-id]]$ ，其中next关于T。
那么依然分类讨论，即可求出ext。

最后贴上一个求next的程序

#include<iostream>
#include<stdio.h>
#include<math.h>
#include<string.h>
#include<algorithm>
#define ll long long
using namespace std;
const char* fin="ex1304.in";
const char* fout="ex1304.out";
const int inf=0x7fffffff;
const int maxn=1000007;
int n,i,j,k,limit,id;
ll ans;
char a[maxn];
int ne[maxn];
int main(){
    scanf("%s",a+1);
    n=strlen(a+1);
    limit=0;
    id=0;
    ne[1]=n;
    for (i=2;i<=n;i++){
        j=ne[i-id+1];
        if (i+j-1<limit) ne[i]=j;
        else{
            j=max(0,limit-i+1);
            for (;j+i<=n;j++) if (a[i+j]!=a[j+1]) break;
            if (i+j-1>limit){
                limit=i+j-1;
                id=i;
            }
            ne[i]=j;
        }
    }
    for (i=1;i<=n;i++) ans+=ne[i];
    printf("%lld",ans);
    return 0;
}

hi微波炉

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【怪物】KMP畸形变种——扩展KMP

问题参考51nod1304这道题；很显然我们要求的是S的每个后缀与S的最长公共前缀的长度之和。暴力假设我们把next[i]表示为第i个后缀与S的最长公共前缀的长度。现在我们想了：这个next数组，如果暴力来求的话，时间复杂度是O(n2)O(n^2)。这是我们回忆一下KMP：KMP物尽其用，然后呢就把求fail的速度提高到了O(n)O(n)。那么我们在求next数组的
复制链接

扫一扫

专栏目录