hdu 1251 统计难题 字典树解释 +字典树模板

字典树

又称单词查找树,Trie 树,是一种树形结构,是一种哈希树的变种。典型应用于统计,排序和保存大量的字符串,经常被搜索引擎系统用于文本词频统计。



字典树与字典很相似,当你要查找一个单词是不是在字典树中,首先看单词的第一个字母是不是在字典树的第一层,如果不在,说明字典树没有该单词,如果在该字母的孩子结点里,找是不是有单词的第二个字母,没有,说明没有该单词,有的话用同样的方法继续查找。

Trie  的数据结构定义

#define MAX 26
typedef struct Trie   
{   
    Trie *next[MAX];   
    int v;   //根据需要变化
};   
 
Trie *root;
next[]是表示每层有多少种类的数,如果只是小写字母,则26即可,若改为大小写字母,则是52,若再加上数字,则是62了,这里根据题意来确定。v可以表示一个字典树到此有多少相同前缀的数目

字典树创建模板()

void createTrie(char *str)
{
    int len = strlen(str);
    Trie *p = root, *q;
    for(int i=0; i<len; ++i)
    {
        int id = str[i]-'0';
        if(p->next[id] == NULL)
        {
            q = (Trie *)malloc(sizeof(Trie));
            q->v = 1;    //初始v==1
            for(int j=0; j<MAX; ++j)
                q->next[j] = NULL;
            p->next[id] = q;
            p = p->next[id];
        }
        else
        {
            p->next[id]->v++;
            p = p->next[id];
        }
    }
}

Trie的查找(最主要的操作):
(1) 每次从根结点开始一次搜索;
(2) 取得要查找关键词的第一个字母,并根据该字母选择对应的子树并转到该子树继续进行检索;   (3) 在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索。   
(4) 迭代过程……   
(5) 在某个结点处,关键词的所有字母已被取出,则读取附在该结点上的信息,即完成查找。

查找模板()

int findTrie(char *str)
{
    int len = strlen(str);
    Trie *p = root;
    for(int i=0; i<len; ++i)
    {
        int id = str[i]-'0';
        p = p->next[id];
        if(p == NULL)   //若为空集,表示不存以此为前缀的串
            return 0;
        if(p->v == -1)   //字符集中已有串是此串的前缀
            return -1;
    }
    return -1;   //此串是字符集中某串的前缀
}



统计难题

Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 131070/65535 K (Java/Others)
Total Submission(s): 19795    Accepted Submission(s): 8671


Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
 

Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

注意:本题只有一组测试数据,处理到文件结束.
 

Output
对于每个提问,给出以该字符串为前缀的单词的数量.
 

Sample Input
      
      
banana band bee absolute acm ba b band abc
 

Sample Output
      
      
2 3 1 0
 

Author
Ignatius.L
 


源代码:

#include<stdio.h>
#include<iostream>
#include<string.h>
using namespace std;
const int MAX=26;
typedef struct Trie
{
	Trie *next[26];
	int v;
}Tire;
Trie root;
void creatTrie(char *str)
{
	int len = strlen(str);
	Trie *p = &root;
	Trie *q;
	for(int i=0;i<len;i++)
	{
		int id=str[i]-'a';
		if(p->next[id]==NULL)//加入新的字母,增加树枝;
		{
		    //q = (Trie *)malloc(sizeof(root)); //开辟空间结点 
		    q = new Trie;
			q->v=1;//初始化统计
			for(int j=0;j<MAX;j++)
			{
				q->next[j]=NULL;//没有使用到的全部置空 
			} 
			p->next[id]=q;
			p=p->next[id]; 
		} 
	    else
	    {
	    	p->next[id]->v++;
	    	p=p->next[id];
	    }
	}
} 
int findTrie(char *str)
{
	int len=strlen(str);
	Trie *p=&root;
	for(int i=0;i<len;i++)
	{
		int id=str[i]-'a';
		p=p->next[id];
		if(p==NULL)//没有走到底的话,就代表不存在以此为前缀的字符串 
		  return 0;
	}//走到底的话
	return p->v; 
} 
int main()
{
	char ss1[15];
	char ss2[15];
	int i;
	for(i=0;i<26;i++)//初始化根各个节点 
	{
		root.next[i]=NULL; 
	} 
	while(gets(ss1)&&ss1[0]!='\0')//如果是空行的话,那么ss1[0]='\0';
	{
		creatTrie(ss1);
	}
	while(scanf("%s",ss2)!=EOF)
	{
		int res=findTrie(ss2);
		printf("%d\n",res);
	}
return 0;
	
}


统计难题

Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 131070/65535 K (Java/Others)
Total Submission(s): 19795    Accepted Submission(s): 8671


Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
 

Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

注意:本题只有一组测试数据,处理到文件结束.
 

Output
对于每个提问,给出以该字符串为前缀的单词的数量.
 

Sample Input
       
       
banana band bee absolute acm ba b band abc
 

Sample Output
       
       
2 3 1 0
 

Author
Ignatius.L
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值