NOI2014 动物园（kmp）

最新推荐文章于 2021-06-22 13:28:28 发布

二三两

最新推荐文章于 2021-06-22 13:28:28 发布

阅读量592

点赞数

分类专栏： kmp。文章标签： kmp

本文链接：https://blog.csdn.net/hfl030/article/details/81047618

版权

kmp。专栏收录该内容

2 篇文章 0 订阅

订阅专栏

题目描述
近日，园长发现动物园中好吃懒做的动物越来越多了。例如企鹅，只会卖萌向游客要吃的。为了整治动物园的不良风气，让动物们凭自己的真才实学向游客要吃的园长决定开设算法班，让动物们学习算法。某天，园长给动物们讲解KMP算法。

园长：“对于一个字符串S它的长度L。我们可以在O(L)的时间内求出一个名为next的数组。有谁预习了next数组的含义吗？”

熊猫：“对于字符串S的前i个字符构成的子串，既是它的后缀又是它的前缀的字符串中，它本身除外，最长的长度记作 next[i]。”

园长:“非常好,那你能举个例子吗?”

熊猫:“例如S为abcababc，则next[5]=2。因为S的前5个字符为abcab，ab既是它的后缀又是它的前缀，并且找不到一个更长的字符串满足这个性质。同理，还可得出 next[1] = next[2] = next[3] = 0, next[4] = next[6] = 1, next[7] = 2, next[8] = 3。”

园长表扬了认真预习的熊猫同学。随后，他详细讲解了如何在O(L)的时间内求出next数组。下课前，园长提出了一个问题：“KMP算法只能求出next数组。我现在希望求出一个更强大num数组——对于字符串S的前 i 个字符构成的子串，既是它的后缀同时又是它的前缀，并且该后缀与该前缀不重叠，将这种字符串的数量记作num[i]。例如S为aaaaa，则num[4]=2。这是因SS的前4个字符为aaaa，其中a和aa都满足性质‘既是后缀又是前缀’，同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’。但遗憾的是这个后缀与这个前缀重叠了，所以不能计算在内。同理，num[1]=0,num[2]=num[3]=1,num[5]=2。”

最后，园长给出了奖励条件，第一个做对的同学奖励巧克力一盒。听了这句话，睡了一节课的企鹅立刻就醒过来了。但企鹅并不会做这道题，于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢？

特别地，为了避免大量的输出，你不需要输出num[i]分别是多少，你只需要输出 $\prod _{i=1}^{L}(num[i]+1)$ 对10000000071000000007取模的结果即可。

其中 $\prod_{i=1}^{n}(num[i]+1)=(num[1]+1)×(num[2]+1)×⋯×(num[n]+1)$ 。

输入格式
输入文件的第1行仅包含一个正整数n。
表示测试数据的组数。随后n行，每行描述一组测试数据。

每组测试数据仅含有一个字符串S，S的定义详见题目描述。数据保证S，中仅含小写字母。输入文件中不会包含多余的空行，行末不会存在多余的空格。

输出格式
输出文件应包含n行。

每行描述一组测试数据的答案。

答案的顺序应与输入数据的顺序保持一致。对于每组测试数据，仅需要输出一个整数，表示这组测试数据的答案对1000000007取模的结果。

输出文件中不应包含多余的空行。

~~为什么要说这么多废话。~~

好啦，题目都指名道姓 kmp 了，当然要用 kmp 乱搞一波。
引入一个定义，kmp自动机：
这里写图片描述
图源 syq学长（？）。！
（我们把既是前缀又是后缀的子串称作字符串的 $boder$ ）。

其实就是个很简单的概念。实际操作中也不需要我们连边，只是借用这样的思路以便于理解。
我们先不考虑题目不允许前缀后缀重复的要求。预处理出 $cnt[i]$ 数组，表示遍历到结点 $i$ 时 $S[ 1..i ]$ 有多少个 $boder$ 。这可以在做一遍 $kmp$ 预处理出 $next$ 数组的同时预处理出来。
如下：

    memset(next,0,sizeof(next));
    memset(cnt,0,sizeof(cnt));
    cnt[1]=1;//注意这里！因为我们对cnt的定义，所以cnt[1]并不是0。
    int j=0;
    for(int i=2;i<=Len;++i)
    {
        while(j&&s[i]!=s[j+1]) j=next[j];
        if(s[i]==s[j+1]) ++j;
        next[i]=j;
        cnt[i]=cnt[j]+1;//通过失配边由父节点递推而来。
    }

好，那我们处理下一步。怎么样满足题目不重叠的要求呢？这一点其实很容易实现。我们再做一遍 $kmp$ 。指针 $j$ 按常规方法跳完之后，我们判断 $j*2$ 是否大于 $i$ 。若大于则说明前缀 $S[1..j]$ 与 $S[i-j+1..i]$ 虽然匹配，但是有重叠，那么我们就非常简单粗暴地将其判断为失配， $j$ 继续前跳。
此时，对于当前匹配到的 $i$ ，满足 $S[1..j]$ 与 $S[i-j+1..i]$ 匹配且两者不重叠的 $j$ 已得到。因为 $S[1..j]$ 满足条件，那么 $j$ 沿失配边上跳得到的 $S[i-j+1..i]$ 的 $boder$ 一定也是合法的。所以题中所求的 $num[i]$ 即为 $cnt[j]$ ，即合法前缀数。
如下：

    j=0;
    for(int i=2;i<=Len;++i)
    {
        while(j&&s[i]!=s[j+1]) j=next[j];
        if(s[i]==s[j+1]) ++j;
        while((j<<1)>i) j=next[j];
        ans=(ans*(1LL*(cnt[j]+1)%mul))%mul;
    }

一个很小的优化：因为我们可以保证 $i$ 相同时，第二次 $kmp$ 调用的值在第一次 $kmp$ 俱已求得。这很显然……所以我们可以把这两个过程塞在一个循环里。
注意 $ans$ 开 $long long$ 。

$Code：$

#include<bits/stdc++.h>
using namespace std;

const int maxn=1000001;
const int mul=1000000007;

int n;
char s[maxn];
int Len;
int next[maxn];
int cnt[maxn];
long long ans;


inline void read(int &x)
{
    x=0;int f=1;char s=getchar();
    for(;s<'0'||s>'9';s=getchar()) if(s=='-') f=-1;
    for(;s>='0'&&s<='9';s=getchar()) x=(x<<3)+(x<<1)+s-48;
    x*=f;
}

void Kmp()
{
    memset(next,0,sizeof(next));
    memset(cnt,0,sizeof(cnt));
    ans=1;
    cnt[1]=1;
    int Point1=0,Point2=0;
    for(int i=2;i<=Len;++i)
    {
        while(Point1&&s[i]!=s[Point1+1]) Point1=next[Point1];
        if(s[i]==s[Point1+1]) ++Point1;
        next[i]=Point1;
        cnt[i]=cnt[Point1]+1;

        while(Point2&&s[i]!=s[Point2+1]) Point2=next[Point2];
        if(s[i]==s[Point2+1]) ++Point2;
        while((Point2<<1)>i) Point2=next[Point2];
        ans=(ans*(1LL*(cnt[Point2]+1)%mul))%mul;
    }
}

void Work()
{
    read(n);
    for(int i=1;i<=n;++i)
    {
        scanf("%s",s+1);Len=strlen(s+1);
        Kmp();
        printf("%lld\n",ans);
    }
}

int main()
{
    Work();
    return 0;
}