统计难题
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131070/65535 K (Java/Others)
Total Submission(s): 7635 Accepted Submission(s): 2972
Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.
注意:本题只有一组测试数据,处理到文件结束.
注意:本题只有一组测试数据,处理到文件结束.
Output
对于每个提问,给出以该字符串为前缀的单词的数量.
Sample Input
banana
band
bee
absolute
acm
ba
b
band
abc
Sample Output
2
3
1
0
题意很明确:先给出若干个字符序列{s1,s2,....sn},然后对于字符串s,求算在{s1,s2,s3...sn}中有多少字符序列是以s为前缀的。很容易想到直接将{s1,s2,s3...sn}用数组存储下来,然后逐个匹配,其时间复杂度为O(n*len(s))。经过尝试,严重超时。因此必须采用其它方法,对于公共前缀的匹配,Trie树无疑是不错的选择。因此,采用Trie树去实现,复杂度便下降至O(len(s))。
实现代码:
/*hdu 1251 单词计数 2011.10.10*/
#include <iostream>
#include<cstdlib>
#include<cstring>
#define MAX 26
using namespace std;
typedef struct TrieNode
{
int prefix;
struct TrieNode *next[MAX];
}Trie;
void insert(Trie *root,char *s)
{
int i;
Trie *p=root;
while(*s!='\0')
{
if(p->next[*s-'a']==NULL)
{
Trie *temp=(Trie *)malloc(sizeof(Trie));
for(i=0;i<MAX;i++)
{
temp->next[i]=NULL;
}
temp->prefix=1;
p->next[*s-'a']=temp;
p=p->next[*s-'a'];
}
else
{
p=p->next[*s-'a'];
p->prefix++;
}
s++;
}
}
int count(Trie *root,char *pre)
{
Trie *p=root;
while(*pre!='\0')
{
if(p->next[*pre-'a']==NULL)
return 0;
else
{
p=p->next[*pre-'a'];
pre++;
}
}
return p->prefix;
}
void del(Trie *root)
{
int i;
for(i=0;i<MAX;i++)
{
if(root->next[i]!=NULL)
{
del(root->next[i]);
}
}
free(root);
}
int main(int argc, char *argv[])
{
int i;
char s[16];
Trie *root=(Trie *)malloc(sizeof(Trie));
for(i=0;i<MAX;i++)
{
root->next[i]=NULL;
}
root->prefix=0;
while(1)
{
gets(s);
if(strcmp(s,"")==0)
break;
insert(root,s);
}
while(gets(s))
{
printf("%d\n",count(root,s));
}
del(root);
return 0;
}