数据结构之字典树

最新推荐文章于 2024-07-13 15:15:51 发布

huangxy10

最新推荐文章于 2024-07-13 15:15:51 发布

阅读量3.5k

点赞数

分类专栏：面试专题——字符串处理/数组文章标签：数据结构 iostream insert search null 搜索引擎

面试专题——字符串处理/数组专栏收录该内容

16 篇文章 0 订阅

订阅专栏

字典树是一种处理字符串的数据结构，主要用于字符串的检索，排序和统计等。

又称单词查找树，Trie树，是一种树形结构，是一种哈希树的变种。

典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），

所以经常被搜索引擎系统用于文本词频统计。

它的优点是：利用字符串的公共前缀来节约存储空间，

最大限度地减少无谓的字符串比较，查询效率比哈希表高。

例题：

统计难题

Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131070/65535 K (Java/Others)
Total Submission(s): 10759 Accepted Submission(s): 4455

Problem Description

Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).

Input

输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

注意:本题只有一组测试数据,处理到文件结束.

Output

对于每个提问,给出以该字符串为前缀的单词的数量.

Sample Input

  
  
   
   banana
band
bee
absolute
acm

ba
b
band
abc

Sample Output

思路：

使用字典树。

代码 
 #include <iostream>
 #include <cstring>
  using namespace std;
 
  struct Node
 {
     int count;
     Node *child[26];
     Node() : count(0)
     {
         for(int i = 0; i < 26; i++)
             child[i] = NULL;
     }
 }*root;
 
  void insert(char *s)
 {
     Node *r = root;
     for (int i = 0; s[i] != '\0'; i++)
     {
         if (r->child[s[i] - 'a'] == NULL)
             r->child[s[i] - 'a'] = new Node();
         r = r->child[s[i] - 'a'];
         r->count++;
     }
 }
 
  int search(char *s)
 {
     Node *r = root;
     for (int i = 0; s[i] != '\0'; i++)
     {
         if (r->child[s[i] - 'a'] == NULL) return 0;
         r = r->child[s[i] - 'a'];
     }
     return r->count;
 }
 
  int main()
 {
     char str[15];
     root = new Node();
     while (gets(str) && strcmp(str, "")) insert(str);
     while (gets(str)) printf("%d\n", search(str));
 }