【巴蜀模拟试题】:L语言(difficult)
Time Limit:10000MS Memory Limit:65536K
Total Submit:10 Accepted:2
Case Time Limit:1000MS
Description
【背景描述】
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。
一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。
例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。
【任务描述】
给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。
Input
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。
其中1 <= n, m <= 20,每个单词长度不超过10,每段文章长度不超过1M。
Output
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
Sample Input
4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname
Sample Output
14
6
0
Hint
14 整段文章’whatisyourname’都能被理解
6 前缀’whatis’能够被理解
0 没有任何前缀能够被理解
//题目描述:给定字典,求给定段落的最长前缀能够由单词组成
//分析:裸的trie+dp,当然AC自动机更快,如果是AC自动机那么对于一个状态,要不停的跳失败指针,类比next函数
//这样才能保证不漏掉状态复杂度 O(段落长*10*m)
下面是AC代码:
#include<iostream>
#include<string>
#include<algorithm>
using namespace std;
char input[1024*1024];
int dp[1024*1024];
struct node
{
int id;
int next[26];
void init(){id=-1;memset(next,-1,sizeof(next));};
}trie[100000];
int p;
int cnt;
void root()
{
trie[p=0].init();
}
void insert(char* a,int id)
{
int index=0;
int len=strlen(a);
int cur,i;
for(i=len-1;i>=0;i--)
{
cur=a[i]-'a';
if(trie[index].next[cur]==-1)
{
trie[++p].init();
trie[index].next[cur]=p;
}
// trie[index].num++;
index=trie[index].next[cur];
}
trie[index].id=id;
}
int find(char *s)
{
int cur,i,j,ans=0,index;
dp[0]=++cnt;
for(i=1;s[i];i++)
{
j=i;
index=0;
while(j>=0)
{
cur=s[j]-'a';
if(trie[index].id!=-1&&dp[j]==cnt)
{
dp[i]=cnt;ans=i;
}
if(trie[index].next[cur]==-1)
{
break;
}
index=trie[index].next[cur];
j--;
}
}
return ans;
}
int main()
{
int n,m;
int i;
char str[100];
cin>>n>>m;
root();
for(i=0;i<n;i++)
{
scanf("%s",str);
insert(str,i);
}
for(i=0;i<m;i++)
{
scanf("%s",input+1);
printf("%d\n",find(input));
}
return 0;
}