题目描述:
JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,
他们现在使用的是GW文本生成器v6版。该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文
章—— 也就是说,生成的文章中每个字节都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,
那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的
标准,使用者现在使用的GW文本生成器v6版所生成的文章也是几乎完全不可读的?。ZYX需要指出GW文本生成器 v6
生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?
输入格式:
输入文件的第一行包含两个正整数,分别是使用者了解的单词总数N,GW文本生成器v6生成的文本固
定长度M;以下N行,每一行包含一个使用者了解的单词。这里所有单词及文本的长度不会超过100,并且只可能包
含英文大写字母A->Z
输出格式:
一个整数,表示可能的文章总数。只需要知道结果模10007的值。
样例:
样例输入:
2 2
A
B
样例输出:
100
数据范围与提示:
对于全部数据,1≤N≤60,所有单词及文本的长度不会超过100,并且只可能包含英文大写字母。
题解:
一看是多模式串,首先应该想到是AC自动机。
如果还不会AC自动机,可以转到这篇博客,个人感觉还是写的挺清楚的:AC自动机讲解+[HDU2222]:Keywords Search(AC自动机)。
那么我们考虑怎么去处理。
爆搜的时间复杂度为26m,显然不能接受。
考虑这样一个问题,所有文章的个数减去所有单词能组成的文章的个数即为答案。
考虑使用DP,定义dp[i][j],表示当前点编号为i,已经匹配的长度为j的方案数,注意存储的为所有单词能组成的文章的个数。
dp[i][j]=∑(dp[father][j-1])。
最后用总的文章个数减去∑(dp[i][m])即可。
代码时刻:
#include<bits/stdc++.h>
using namespace std;
int n,m;
char s[101];
int trie[6001][30],cnt=1,ed[6001],nxt[6001];
int dp[6001][101];//dp[i][j]表示当前点编号为i,已经匹配的长度为j的方案数。
int que[6001];
int ans=1;
void insert(char *str)//建树
{
int len=strlen(str);
if(len>m)return;
int p=1;
for(int i=0;i<len;i++)
{
int ch=str[i]-'A';
if(!trie[p][ch])trie[p][ch]=++cnt;
p=trie[p][ch];
}
ed[p]=1;
}
void build()//找Fail指针
{
for(int i=0;i<26;i++)trie[0][i]=1;
que[1]=1;
int head=1,tail=1;
while(head<=tail)
{
for(int i=0;i<26;i++)
{
if(!trie[que[head]][i])trie[que[head]][i]=trie[nxt[que[head]]][i];
else
{
que[++tail]=trie[que[head]][i];
nxt[trie[que[head]][i]]=trie[nxt[que[head]]][i];
ed[trie[que[head]][i]]|=ed[trie[nxt[que[head]]][i]];
}
}
head++;
}
}
void ask()//dp全过程
{
dp[1][0]=1;
for(int i=1;i<=m;i++)
{
for(int j=1;j<=cnt;j++)
{
if(ed[j])continue;
for(int k=0;k<26;k++)
{
if(ed[trie[j][k]])continue;
dp[trie[j][k]][i]=(dp[j][i-1]+dp[trie[j][k]][i])%10007;//转移
}
}
}
for(int i=1;i<=m;i++)ans=(ans*26)%10007;
for(int i=1;i<=cnt;i++)ans=(ans+10007-dp[i][m])%10007;//答案要减去
}
int main()
{
scanf("%d%d",&n,&m);
for(int i=1;i<=n;i++)
{
scanf("%s",s);
insert(s);
}
build();
ask();
cout<<ans;
return 0;
}
rp++