题目描述
近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的园长决定开设算法班,让动物们学习算法。 某天,园长给动物们讲解KMP算法。
园长:“对于一个字符串S它的长度L。我们可以在O(L)的时间内求出一个名为next的数组。有谁预习了next数组的含义吗?”
熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中,它本身除外,最长的长度记作 next[i]。”
园长:“非常好,那你能举个例子吗?”
熊猫:“例如S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出 next[1] = next[2] = next[3] = 0, next[4] = next[6] = 1, next[7] = 2, next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组——对于字符串S的前 i 个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4]=2。这是因SS的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’。但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1]=0,num[2]=num[3]=1,num[5]=2。”
最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了。但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?
特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出 ∏Li=1(num[i]+1) ∏ i = 1 L ( n u m [ i ] + 1 ) 对10000000071000000007取模的结果即可。
其中 ∏ni=1(num[i]+1)=(num[1]+1)×(num[2]+1)×⋯×(num[n]+1) ∏ i = 1 n ( n u m [ i ] + 1 ) = ( n u m [ 1 ] + 1 ) × ( n u m [ 2 ] + 1 ) × ⋯ × ( n u m [ n ] + 1 ) 。
输入格式
输入文件的第1行仅包含一个正整数n。
表示测试数据的组数。 随后n行,每行描述一组测试数据。
每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S,中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。
输出格式
输出文件应包含n行。
每行描述一组测试数据的答案。
答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对1000000007取模的结果。
输出文件中不应包含多余的空行。
为什么要说这么多废话。
好啦,题目都指名道姓 kmp 了,当然要用 kmp 乱搞一波。
引入一个定义,kmp自动机:
图源 syq学长(?)。!
(我们把既是前缀又是后缀的子串称作字符串的
boder
b
o
d
e
r
)。
其实就是个很简单的概念。实际操作中也不需要我们连边,只是借用这样的思路以便于理解。
我们先不考虑题目不允许前缀后缀重复的要求。预处理出
cnt[i]
c
n
t
[
i
]
数组,表示遍历到结点
i
i
时有多少个
boder
b
o
d
e
r
。这可以在做一遍
kmp
k
m
p
预处理出
next
n
e
x
t
数组的同时预处理出来。
如下:
memset(next,0,sizeof(next));
memset(cnt,0,sizeof(cnt));
cnt[1]=1;//注意这里!因为我们对cnt的定义,所以cnt[1]并不是0。
int j=0;
for(int i=2;i<=Len;++i)
{
while(j&&s[i]!=s[j+1]) j=next[j];
if(s[i]==s[j+1]) ++j;
next[i]=j;
cnt[i]=cnt[j]+1;//通过失配边由父节点递推而来。
}
好,那我们处理下一步。怎么样满足题目不重叠的要求呢?这一点其实很容易实现。我们再做一遍
kmp
k
m
p
。指针
j
j
按常规方法跳完之后,我们判断是否大于
i
i
。若大于则说明前缀与
S[i−j+1..i]
S
[
i
−
j
+
1..
i
]
虽然匹配,但是有重叠,那么我们就非常简单粗暴地将其判断为失配,
j
j
继续前跳。
此时,对于当前匹配到的,满足
S[1..j]
S
[
1..
j
]
与
S[i−j+1..i]
S
[
i
−
j
+
1..
i
]
匹配且两者不重叠的
j
j
已得到。因为满足条件,那么
j
j
沿失配边上跳得到的的
boder
b
o
d
e
r
一定也是合法的。所以题中所求的
num[i]
n
u
m
[
i
]
即为
cnt[j]
c
n
t
[
j
]
,即合法前缀数。
如下:
j=0;
for(int i=2;i<=Len;++i)
{
while(j&&s[i]!=s[j+1]) j=next[j];
if(s[i]==s[j+1]) ++j;
while((j<<1)>i) j=next[j];
ans=(ans*(1LL*(cnt[j]+1)%mul))%mul;
}
一个很小的优化:因为我们可以保证
i
i
相同时,第二次调用的值在第一次
kmp
k
m
p
俱已求得。这很显然……所以我们可以把这两个过程塞在一个循环里。
注意
ans
a
n
s
开
longlong
l
o
n
g
l
o
n
g
。
Code: C o d e :
#include<bits/stdc++.h>
using namespace std;
const int maxn=1000001;
const int mul=1000000007;
int n;
char s[maxn];
int Len;
int next[maxn];
int cnt[maxn];
long long ans;
inline void read(int &x)
{
x=0;int f=1;char s=getchar();
for(;s<'0'||s>'9';s=getchar()) if(s=='-') f=-1;
for(;s>='0'&&s<='9';s=getchar()) x=(x<<3)+(x<<1)+s-48;
x*=f;
}
void Kmp()
{
memset(next,0,sizeof(next));
memset(cnt,0,sizeof(cnt));
ans=1;
cnt[1]=1;
int Point1=0,Point2=0;
for(int i=2;i<=Len;++i)
{
while(Point1&&s[i]!=s[Point1+1]) Point1=next[Point1];
if(s[i]==s[Point1+1]) ++Point1;
next[i]=Point1;
cnt[i]=cnt[Point1]+1;
while(Point2&&s[i]!=s[Point2+1]) Point2=next[Point2];
if(s[i]==s[Point2+1]) ++Point2;
while((Point2<<1)>i) Point2=next[Point2];
ans=(ans*(1LL*(cnt[Point2]+1)%mul))%mul;
}
}
void Work()
{
read(n);
for(int i=1;i<=n;++i)
{
scanf("%s",s+1);Len=strlen(s+1);
Kmp();
printf("%lld\n",ans);
}
}
int main()
{
Work();
return 0;
}