在vj上拉了一些题,有一题它需要用到trie树。
题目大意是这样的:给一个单词表(只有小写字母组成,不会有重复的单词出现),让我们统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
Sample Input
banana
band
bee
absolute
acm
ba
b
band
abc
Sample Output
2
3
1
0
这种前缀的问题,在我不知道trie树的时候,就暴力嘛(暴力出真知/斜眼笑)!每个字符串从单词表开始到结尾依次判断,但是时间复杂度就很大了,这个复杂度有O(n^2),如果n很大,这显然是不好的。
所以介绍trie算法。
参考一位巨巨的文章:
http://blog.csdn.net/hackbuteer1/article/details/7964147
prie树:
特征:
(1)根节点设为空,其他的每个节点只包含一个字符。
(2)从根节点到树中的某一个节点,路上经过的字符从上到下连接起来,为该节点对应的字符串。
举例:
banana
band
bee
absolute
acm
NULL ->a->b->s->o->l->u->t->e
->c->m
->b->a->n->a->n->a
->d
因为没有找到合适的画树图软件,就用上面的表示,从NULL开始,同一列的为同一层。
Trie树结点结构体声明如下。
typedef struct Trie_node
{
int count; // 统计从根节点到此结点的字符串出现的次数
struct Trie_node* next[26]; // 指向各个子树的指针,字母26个
bool exist; // 标记此结点是否构成单词
}TrieNode , *Trie;
创建新结点:
用malloc开辟一个地址,将此结点的count置0,子树置空,构成单词标记置false。
TrieNode* createTrieNode()
{
TrieNode* node = (TrieNode *)malloc(sizeof(TrieNode));
node->count = 0;
node->exist = false;
memset(node->next, NULL, sizeof(node->next));
return node;
}
创建单词表:
这里就开始了trie树的build了,注意从根结点开始进行建树,过程通过字符的id来判断子树是否被创建过,如果没有创建过,就malloc一个子结点,然后到达子节点,依次往下。
举例:
注意括号中为count数
单词1:banana:
NULL ->b(1)->a(1)->n(1)->a(1)->n(1)->a(1) 此单词构建完成,最后一个a结点的exit置为true。
单词2:band:
NULL->b(2)->a(2)->n(2)->a(1)->n(1)->a(1) ->d(1) 此单词构建完毕,发现结点b,a,n的count数变成了2,并且结点d的exit置为true。
代码如下:
void Trie_insert(Trie root, char* word)
{
Trie node = root;
char *p = word;
int id;
while( *p )
{
id = *p - 'a';
if(node->next[id] == NULL)
{
node->next[id] = createTrieNode();
}
node = node->next[id];
++p;
node->count += 1;
}
node->exist = true;
}
查询:
从NULL开始,取s[i],依次判断node->next[s[i]-‘a’]是否为空,如果为空,说明单词中没有要查询的字符串的字符,则返回0;否则就取最后一个结点的count。
就上面的例子来看,即现在的trie树为:
NULL->b(2)->a(2)->n(2)->a(1)->n(1)->a(1)
->d(1)
我们查询字符串s为“ba”:
1.先是‘b’:从NULL开始发现下一个结点是b,继续
2.最后是‘a’:从b开始发现下一个结点是a,则返回2。
单词表是banana 和 band , 查询的是“ba”,的确是两个单词的前缀。
int Trie_search(Trie root, char* word)
{
Trie node = root;
char *p = word;
int id;
while( *p )
{
id = *p - 'a';
node = node->next[id];
++p;
if(node == NULL) return 0;
}
return node->count;
}
完整代码如下:
#include<cstdio>
#include<cstring>
#include<iostream>
#include<malloc.h>
using namespace std;
/*声明结构体*/
typedef struct Trie_node{
int count;
struct Trie_node* next[26];
bool exist;
}TrieNode, *Trie;
/*创建新结点*/
TrieNode* createTrieNode()
{
TrieNode* node = (TrieNode *)malloc(sizeof(TrieNode));
node->count = 0;
node->exist = false;
memset(node->next, NULL, sizeof(node->next));
return node;
}
/*建trie树*/
void Trie_insert(Trie root, char* word)
{
Trie node = root;
char *p = word;
int id;
while( *p )
{
id = *p - 'a';
if(node->next[id] == NULL)
{
node->next[id] = createTrieNode();
}
node = node->next[id];
++p;
node->count += 1;
}
node->exist = true;
}
/*查询*/
int Trie_search(Trie root, char* word)
{
Trie node = root;
char *p = word;
int id;
while( *p )
{
id = *p - 'a';
node = node->next[id];
++p;
if(node == NULL) return 0;
}
return node->count;
}
int main()
{
Trie root = createTrieNode();
char str[12];
bool flag = false;
while(gets(str))
{
if(flag) printf("%d\n", Trie_search(root, str));
else{
if(strlen(str) != 0)
{
Trie_insert(root, str);
}else{
flag = true;
}
}
}
return 0;
}