数据结构之Trie树

1、什么是Trie树  

  Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。

    Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。
它有3个基本性质:
    1.根节点不包含字符,除根节点外每一个节点都只包含一个字符。
    2.
从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
    3.
每个节点的所有子节点包含的字符都不相同。

2、Trie树的构建
     本质上,Trie是一颗存储多个字符串的树。相邻节点间的边代表一个字符,这样树的每条分支代表一则子串,而树的叶节点则代表完整的字符串。和普通树不同的地方是,相同的字符串前缀共享同一条分支。举一个例子。给出一组单词,inn, int, at, age, adv, ant, 我们可以得到下面的Trie:

搭建Trie的基本算法很简单,无非是逐一把每则单词的每个字母插入Trie。插入前先看前缀是否存在。如果存在,就共享,否则创建对应的节点和边。比如要插入单词add,就有下面几步:
    1.
考察前缀"a",发现边a已经存在。于是顺着边a走到节点a。
    2.
考察剩下的字符串"dd"的前缀"d",发现从节点a出发,已经有边d存在。于是顺着边d走到节点ad
    3.
考察最后一个字符"d",这下从节点ad出发没有边d了,于是创建节点ad的子节点add,并把边ad->add标记为d。

具体Trie树的创建、插入、查询代码如下所示:

  1. //此函数只考虑26个英文字母的情况
  2. #include<iostream>
  3. #include<cstring>
  4. using namespace std;
  5. #define MAX_CHILD 26
  6. typedef struct Tree
  7. {
  8.     int count;         //用来标记该节点是个可以形成一个单词,如果count!=0,则从根节点到该节点的路径可以形成一个单词
  9.     struct Tree *child[MAX_CHILD];
  10. }Node,*Trie_node;

  11. Node* CreateTrie()                             //创建trie节点树
  12. {
  13.     Node *node=(Node*)malloc(sizeof(Node));
  14.     memset(node,0,sizeof(Node));
  15.     return node;
  16. }

  17. void insert_node(Trie_node root,char *str)      //trie树插入结点
  18. {
  19.     if(root ==NULL || *str=='\0')
  20.         return;
  21.     Node *t=root; 

  22.     char *p=str;
  23.     
  24.     while(*p!='\0')
  25.     {
  26.      if(t->child[*p-'a']==NULL)
  27.         {
  28.          Node *tmp=CreateTrie();
  29.          t->child[*p-'a']=tmp;        
  30.         }
  31.      t=t->child[*p-'a'];
  32.      p++;
  33.     }
  34.     t->count++;
  35. }

  36. void search_str(Trie_node root,char *str)             //查找串是否在该trie树中
  37. {
  38.     if(NULL==root || *str=='\0')
  39.     {
  40.      printf("trie is empty or str is null\n");
  41.      return;
  42.     }

  43.     char *p=str;
  44.     Node *t=root;
  45.     while(*p!='\0')
  46.     {     
  47.      if(t->child[*p-'a']!=NULL)
  48.         {
  49.          t=t->child[*p-'a'];
  50.             p++;
  51.         }
  52.      else
  53.              break;
  54.     }
  55.     if(*p=='\0')
  56.     {
  57.      if(t->count==0)
  58.             cout<<"该字符串不在trie树中,但该串是某个单词的前缀\n";
  59.         else
  60.             cout<<"该字符串在该trie树中\n";
  61.     }
  62.     else
  63.         cout<<"该字符串不在trie树中\n";
  64. }

  65. void del(Trie_node root)      //释放整个字典树占的堆空间
  66. {
  67.     int i;
  68.     for(i=0;i<MAX_CHILD;i++)
  69.     {
  70.      if(root->child[i]!=NULL)
  71.             del(root->child[i]);
  72.     }
  73.     free(root);
  74. }

  75. int main()
  76. {
  77.     int i,n;
  78.     char str[20];
  79.     cout<<"请输入要创建的trie树的大小:";
  80.     cin>>n; 
  81.     Trie_node root=NULL;
  82.     root=CreateTrie(); 
  83.     if(root==NULL)
  84.         cout<<"创建trie树失败";
  85.     for(i=0;i<n;i++) 
  86.     {
  87.         scanf("%s",str);
  88.         insert_node(root,str);
  89.     }
  90.     cout<<"trie树已建立完成\n";
  91.     cout<<"请输入要查询的字符串:";
  92.     while(scanf("%s",str)!=NULL)
  93.     {
  94.      search_str(root,str);
  95.     
  96.     }
  97.     return 0;
  98. }

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qinjianhuang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值