HDU 1251 统计难题 (Trie树——字符串算法)

在vj上拉了一些题,有一题它需要用到trie树。
题目大意是这样的:给一个单词表(只有小写字母组成,不会有重复的单词出现),让我们统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).

Sample Input

banana
band
bee
absolute
acm

ba
b
band
abc

Sample Output

2
3
1
0

这种前缀的问题,在我不知道trie树的时候,就暴力嘛(暴力出真知/斜眼笑)!每个字符串从单词表开始到结尾依次判断,但是时间复杂度就很大了,这个复杂度有O(n^2),如果n很大,这显然是不好的。

所以介绍trie算法。
参考一位巨巨的文章:
http://blog.csdn.net/hackbuteer1/article/details/7964147

prie树:

特征:

(1)根节点设为空,其他的每个节点只包含一个字符。
(2)从根节点到树中的某一个节点,路上经过的字符从上到下连接起来,为该节点对应的字符串。

举例:

banana
band
bee
absolute
acm

NULL ->a->b->s->o->l->u->t->e
        ->c->m
     ->b->a->n->a->n->a
              ->d

因为没有找到合适的画树图软件,就用上面的表示,从NULL开始,同一列的为同一层。
Trie树结点结构体声明如下。

typedef struct Trie_node  
{  
    int count;                    // 统计从根节点到此结点的字符串出现的次数  
    struct Trie_node* next[26];   // 指向各个子树的指针,字母26个  
    bool exist;                   // 标记此结点是否构成单词
}TrieNode , *Trie;  

创建新结点:

用malloc开辟一个地址,将此结点的count置0,子树置空,构成单词标记置false。

TrieNode* createTrieNode()
{
    TrieNode* node = (TrieNode *)malloc(sizeof(TrieNode));
    node->count = 0;
    node->exist = false;
    memset(node->next, NULL, sizeof(node->next));
    return node;
}

创建单词表:

这里就开始了trie树的build了,注意从根结点开始进行建树,过程通过字符的id来判断子树是否被创建过,如果没有创建过,就malloc一个子结点,然后到达子节点,依次往下。

举例:
注意括号中为count数

  • 单词1:banana

    NULL ->b(1)->a(1)->n(1)->a(1)->n(1)->a(1)  
    此单词构建完成,最后一个a结点的exit置为true。
    
  • 单词2:band

    NULL->b(2)->a(2)->n(2)->a(1)->n(1)->a(1)
                          ->d(1)
    此单词构建完毕,发现结点b,a,n的count数变成了2,并且结点d的exit置为true。
    

    代码如下:

void Trie_insert(Trie root, char* word)
{
    Trie node = root;
    char *p = word;
    int id;
    while( *p )
    {
        id = *p - 'a';
        if(node->next[id] == NULL)
        {
            node->next[id] = createTrieNode();
        }
        node = node->next[id];
        ++p;
        node->count += 1;
    }
    node->exist = true;
}

查询:

从NULL开始,取s[i],依次判断node->next[s[i]-‘a’]是否为空,如果为空,说明单词中没有要查询的字符串的字符,则返回0;否则就取最后一个结点的count。

就上面的例子来看,即现在的trie树为:

NULL->b(2)->a(2)->n(2)->a(1)->n(1)->a(1)
                      ->d(1)

我们查询字符串s为“ba”
1.先是‘b’:从NULL开始发现下一个结点是b,继续
2.最后是‘a’:从b开始发现下一个结点是a,则返回2。

单词表是banana 和 band , 查询的是“ba”,的确是两个单词的前缀。

int Trie_search(Trie root, char* word)
{
    Trie node = root;
    char *p = word;
    int id;
    while( *p )
    {
        id = *p - 'a';
        node = node->next[id];
        ++p;
        if(node == NULL) return 0;
    }
    return node->count;
}

完整代码如下:

#include<cstdio>
#include<cstring>
#include<iostream>
#include<malloc.h>
using namespace std;
/*声明结构体*/
typedef struct Trie_node{
    int count;
    struct Trie_node* next[26];
    bool exist;
}TrieNode, *Trie;
/*创建新结点*/
TrieNode* createTrieNode()
{
    TrieNode* node = (TrieNode *)malloc(sizeof(TrieNode));
    node->count = 0;
    node->exist = false;
    memset(node->next, NULL, sizeof(node->next));
    return node;
}
/*建trie树*/
void Trie_insert(Trie root, char* word)
{
    Trie node = root;
    char *p = word;
    int id;
    while( *p )
    {
        id = *p - 'a';
        if(node->next[id] == NULL)
        {
            node->next[id] = createTrieNode();
        }
        node = node->next[id];
        ++p;
        node->count += 1;
    }
    node->exist = true;
}
/*查询*/
int Trie_search(Trie root, char* word)
{
    Trie node = root;
    char *p = word;
    int id;
    while( *p )
    {
        id = *p - 'a';
        node = node->next[id];
        ++p;
        if(node == NULL) return 0;
    }
    return node->count;
}

int main()
{
    Trie root = createTrieNode();
    char str[12];
    bool flag = false;
    while(gets(str))
    {
        if(flag) printf("%d\n", Trie_search(root, str));
        else{
            if(strlen(str) != 0)
            {
                Trie_insert(root, str);
            }else{
                flag = true;
            }
        }
    }
    return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值