1212: [HNOI2004]L语言
Time Limit: 10 Sec Memory Limit: 162 MB
Submit: 1768 Solved: 789
[Submit][Status][Discuss]
Description
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。 一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’ 在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解 而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。 并给出其在字典D下能够被理解的最长前缀的位置。
Input
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。 之后的n行每行描述一个单词,再之后的m行每行描述一段文章。 其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。
Output
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
Sample Input
4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname
Sample Output
14
6
0 整段文章’whatisyourname’都能被理解
前缀’whatis’能够被理解
没有任何前缀能够被理解
题解
显然可以看出这道题是不可以用kmp做的(很容易就可以举出反例),然后这种字符串匹配类的算法就剩下Trie和AC自动机,然而看数据来说如果常数优秀的话是可以用Trie写的(AC太长懒得写。。。),所以具体做法就是Trie+DP。
代码
#include<bits/stdc++.h>
using namespace std;
int n,T,m;
char s[20500000];
int can[20500000];
struct Trie{
Trie *son[30];
bool End;
Trie(){for(int i=0;i<=30;i++) son[i]=NULL;End=false;}
inline void add(char T[],Trie *x){
int len=strlen(T);
for(int i=0;i<len;i++){
int z=T[i]-'a'+1;
if(x->son[z]==NULL) x->son[z]=new Trie();
x=x->son[z];
}
x->End=true;
}
bool word(char c){
if(c>='a'&&c<='z') return true;
if(c>='A'&&c<='Z') return true;
return false;
}
inline int DP(char T[],Trie *x){
int len=strlen(T);
int anss=0,l=0;
memset(can,0,sizeof(can));
can[0]=1;
for(int i=0;i<=len;i++){
if(can[i]){
anss=i;
Trie *now=x;
for(int k=i;k<=len;k++){
int z=T[k]-'a'+1;
if(x->End) can[k]=1;
if(!word(T[k])) break;
if(x->son[z]==NULL) break;
x=x->son[z];
}
x=now;
}
}
return anss;
}
}*trie;
int main(){
trie=new Trie();
scanf("%d%d",&n,&m);
for(int i=1;i<=n;i++){
scanf("%s",s);
trie->add(s,trie);
}
for(int i=1;i<=m;i++){
scanf("%s",s);
printf("%d\n",trie->DP(s,trie));
}
return 0;
}