树之字典树

统计难题

Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 131070/65535 K (Java/Others)Total Submission(s): 15475    Accepted Submission(s): 6620

Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
 

Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.注意:本题只有一组测试数据,处理到文件结束.
 

Output
对于每个提问,给出以该字符串为前缀的单词的数量.
 

Sample Input
   
   
banana band bee absolute acm ba b band abc
 

Sample Output
    
    
2 3 1 0
 

字典树:

要理解字典树,就要深刻理解字典树的原理,也就是字典树建立和查找的过程。

字典树是一棵树,所以要从节点开始讲起:下面的代码中,首先有一个结构体,这个结构体实际就是一个有特征的节点,那么这个节点要与有什么特证呢

1.记录建立字典树过程中通过这个节点的共享字母的个数;

2.能够指向另一个结构体,画出字典树的话就是它指向的另一个节点,因为这是棵树,需要边的链接,这里用链表进行连接,起贬的作用。

在建立过程中,要记忆下经过的次数(走过留痕),以便查找方便。

比如,abc abd abf,在建立的过程中,总是从根部开始,所以经过第一层时a留了三次痕,第二层是三次,第三次c,d,f 都各自留了一次,所以在

进行查找时,如果是ab,那么再走,这次不留痕,而是找痕,到结尾时,b所在的留痕数是3,所以前缀相同的就是三个。

字典树是一种简单但是用途广泛的数据结构,这只是基本的思路,在实际中遇到的各种奇葩题还是得具体情况具体分析,上代码:

Author
Ignatius.L
#include <iostream>
#include <cstdio>
using namespace std;
struct Trie
{
    int v;//v可以根据实际情况任意变化,在这里v是每个字母的次数; 
	Trie *next[26];	
};
Trie root;
void createTrie(char *str)//建立字典树; 
{
	int len=strlen(str);
	Trie *p=&root,*q;
	for(int i=0;i<len;i++)
	{
		int id=str[i]-'a';
		if(p->next[id]==NULL)
		{
			q=(Trie *)malloc(sizeof(root));//申请一块新内存; 
			q->v=1;//v遇到新字母每一层都初始化为1; 
			for(int j=0;j<26;j++)
			q->next[j]=NULL;
			p->next[id]=q;
			p=p->next[id];
		}
		else 
		{
			p->next[id]->v++;//当第一个输入的字符串和后面又相等的时候,v++; 
			p=p->next[id];
		}
	}
}
int findTrie(char *str)//在字典树里查询; 
{
	int len=strlen(str);
	Trie *p=&root;
	for(int i=0;i<len;i++)
	{
		int id=str[i]-'a';
		p=p->next[id];
		if(p==NULL)
		return 0;
	}
	return p->v;//相同的字母个数; 
}
int main()
{
	char str[15];
	for(int i=0;i<26;i++)
	root.next[i]=NULL;
	while(gets(str)&&str[0]!='\0')
	{
		createTrie(str);
	}
	while(cin>>str)
	{
		int ans=findTrie(str);
		cout<<ans<<endl;
	}
	return 0;
}
同学又有了一种不用链表的方法,不错,就是不太好想,一般人在这么短的时间里能想到的话,那他肯定是大神级别的吧,下面是
代码,有注释,可以理解理解:
cur在这里有一个指针的作用,就是判断下一个字母的位置,这里将每一个字母都定义在了一个cur里,因为有26个字母,所以每一行
里面有26种方法,就是26个-1,这些值都在trie里存着,一旦字典创立到第cur层时,对应的字母就翻转为1,这样就标记了走过。
当然,最难理解的就是离散的存入字典的方法,因为不是用的链表,所以不能将在某一时刻存入的值进行合理的插入,所以在遇到
不同的字典字母时,要将他排在最后。在查阅时利用cur进行跳跃走过来,当然在这个过程,有一个很重要的步骤,就是进行记忆
在字典中出现字母的次数,这就要求在标记的时候做点手脚,将走过的次数也记录下来,你如果不懂我在说什么,下面是各个变量
的含义:
pass【maxn】:记录建立过程中每个字母的个数;
 trie【maxn】【26】:记录走过还是没走,同时对他进行递增赋值来起到换行的目的;
cur:行;
代码:
#include<stdio.h>
#include<string.h>
#define maxn 400000
int trie[maxn][26];
int pass[maxn];
int main()
{
    int i,j,len,cur,num,alloc=1;
    char str[10];
    memset(trie,-1,sizeof(trie));
    memset(pass,0,sizeof(pass));
    while(gets(str),strlen(str)>0)
    {
        len=strlen(str);
        cur=0;
        for(i=0;i<len;i++)
        {
            if(trie[cur][str[i]-'a']==-1)
            {
                trie[cur][str[i]-'a']=alloc;
                alloc++;
            }
            cur=trie[cur][str[i]-'a'];// 
            pass[cur]++;
        }
    }
    while(gets(str))
    {
        len=strlen(str);
        num=cur=0;
        for(i=0;i<len;i++)
        {
            if(trie[cur][str[i]-'a']==-1)break;
            cur=trie[cur][str[i]-'a'];
            if(i==len-1)num=pass[cur];
        }
        printf("%d\n",num);
    }
    return 0;
}



 
 
   
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值