字典树是一种处理字符串的数据结构,主要用于字符串的检索,排序和统计等。
又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),
所以经常被搜索引擎系统用于文本词频统计。
它的优点是:利用字符串的公共前缀来节约存储空间,
最大限度地减少无谓的字符串比较,查询效率比哈希表高。
例题:
统计难题
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131070/65535 K (Java/Others)Total Submission(s): 10759 Accepted Submission(s): 4455
Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.
注意:本题只有一组测试数据,处理到文件结束.
注意:本题只有一组测试数据,处理到文件结束.
Output
对于每个提问,给出以该字符串为前缀的单词的数量.
Sample Input
banana band bee absolute acm ba b band abc
Sample Output
2 3 1 0
思路:
使用字典树。
代码
#include <iostream>
#include <cstring>
using namespace std;
struct Node
{
int count;
Node *child[26];
Node() : count(0)
{
for(int i = 0; i < 26; i++)
child[i] = NULL;
}
}*root;
void insert(char *s)
{
Node *r = root;
for (int i = 0; s[i] != '\0'; i++)
{
if (r->child[s[i] - 'a'] == NULL)
r->child[s[i] - 'a'] = new Node();
r = r->child[s[i] - 'a'];
r->count++;
}
}
int search(char *s)
{
Node *r = root;
for (int i = 0; s[i] != '\0'; i++)
{
if (r->child[s[i] - 'a'] == NULL) return 0;
r = r->child[s[i] - 'a'];
}
return r->count;
}
int main()
{
char str[15];
root = new Node();
while (gets(str) && strcmp(str, "")) insert(str);
while (gets(str)) printf("%d\n", search(str));
}