统计难题
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131070/65535 K (Java/Others)Total Submission(s): 30080 Accepted Submission(s): 11716
Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.
注意:本题只有一组测试数据,处理到文件结束.
注意:本题只有一组测试数据,处理到文件结束.
Output
对于每个提问,给出以该字符串为前缀的单词的数量.
Sample Input
banana band bee absolute acm ba b band abc
Sample Output
2 3 1 0
Author
Ignatius.L
解题思路:
又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。
字典树与字典很相似,当你要查一个单词是不是在字典树中,首先看单词的第一个字母是不是在字典的第一层,如果不在,说明字典树里没有该单词,如果在就在该字母的孩子节点里找是不是有单词的第二个字母,没有说明没有该单词,有的话用同样的方法继续查找.字典树不仅可以用来储存字母,也可以储存数字等其它数据。
#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
typedef struct node
{
int cnt;
node* next[26];
} Trie;
Trie root;
void Creat_Trie(char*str)
{
int len,i,j;
len=strlen(str);
Trie *p=&root,*q;
for( i=0; i<len; i++){
int id=str[i]-'a';
if( p->next[id]==NULL){
q=new Trie;
q->cnt=1;
for( j=0; j<26; j++)
q->next[j]=NULL;
p->next[id]=q;
p=p->next[id];
}
else{
p->next[id]->cnt++;
p=p->next[id];
}
}
}
int Find_Trie(char*str)
{
int len,i,j,id;
len=strlen(str);
Trie*p=&root;
for( i=0; i<len; i++){
id=str[i]-'a';
p=p->next[id];
if( p==NULL)
return 0;
}
return p->cnt;
}
int main()
{
char str[15];
int i,ans;
for( i=0; i<26; i++)
root.next[i]=NULL;
while( gets(str)&&str[0]!='\0')
Creat_Trie(str);
memset(str,0,sizeof(str));
while( scanf("%s",&str)!=EOF){
ans=Find_Trie(str);
printf("%d\n",ans);
}
return 0;
}