统计难题
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131070/65535 K (Java/Others)Total Submission(s): 15475 Accepted Submission(s): 6620
Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.注意:本题只有一组测试数据,处理到文件结束.
Output
对于每个提问,给出以该字符串为前缀的单词的数量.
Sample Input
banana
band
bee
absolute
acm
ba
b
band
abc
Sample Output
2
3
1
0
字典树:
要理解字典树,就要深刻理解字典树的原理,也就是字典树建立和查找的过程。
字典树是一棵树,所以要从节点开始讲起:下面的代码中,首先有一个结构体,这个结构体实际就是一个有特征的节点,那么这个节点要与有什么特证呢
1.记录建立字典树过程中通过这个节点的共享字母的个数;
2.能够指向另一个结构体,画出字典树的话就是它指向的另一个节点,因为这是棵树,需要边的链接,这里用链表进行连接,起贬的作用。
在建立过程中,要记忆下经过的次数(走过留痕),以便查找方便。
比如,abc abd abf,在建立的过程中,总是从根部开始,所以经过第一层时a留了三次痕,第二层是三次,第三次c,d,f 都各自留了一次,所以在
进行查找时,如果是ab,那么再走,这次不留痕,而是找痕,到结尾时,b所在的留痕数是3,所以前缀相同的就是三个。
字典树是一种简单但是用途广泛的数据结构,这只是基本的思路,在实际中遇到的各种奇葩题还是得具体情况具体分析,上代码:
Author
Ignatius.L
#include <iostream>
#include <cstdio>
using namespace std;
struct Trie
{
int v;//v可以根据实际情况任意变化,在这里v是每个字母的次数;
Trie *next[26];
};
Trie root;
void createTrie(char *str)//建立字典树;
{
int len=strlen(str);
Trie *p=&root,*q;
for(int i=0;i<len;i++)
{
int id=str[i]-'a';
if(p->next[id]==NULL)
{
q=(Trie *)malloc(sizeof(root));//申请一块新内存;
q->v=1;//v遇到新字母每一层都初始化为1;
for(int j=0;j<26;j++)
q->next[j]=NULL;
p->next[id]=q;
p=p->next[id];
}
else
{
p->next[id]->v++;//当第一个输入的字符串和后面又相等的时候,v++;
p=p->next[id];
}
}
}
int findTrie(char *str)//在字典树里查询;
{
int len=strlen(str);
Trie *p=&root;
for(int i=0;i<len;i++)
{
int id=str[i]-'a';
p=p->next[id];
if(p==NULL)
return 0;
}
return p->v;//相同的字母个数;
}
int main()
{
char str[15];
for(int i=0;i<26;i++)
root.next[i]=NULL;
while(gets(str)&&str[0]!='\0')
{
createTrie(str);
}
while(cin>>str)
{
int ans=findTrie(str);
cout<<ans<<endl;
}
return 0;
}
同学又有了一种不用链表的方法,不错,就是不太好想,一般人在这么短的时间里能想到的话,那他肯定是大神级别的吧,下面是
代码,有注释,可以理解理解:
cur在这里有一个指针的作用,就是判断下一个字母的位置,这里将每一个字母都定义在了一个cur里,因为有26个字母,所以每一行
里面有26种方法,就是26个-1,这些值都在trie里存着,一旦字典创立到第cur层时,对应的字母就翻转为1,这样就标记了走过。
当然,最难理解的就是离散的存入字典的方法,因为不是用的链表,所以不能将在某一时刻存入的值进行合理的插入,所以在遇到
不同的字典字母时,要将他排在最后。在查阅时利用cur进行跳跃走过来,当然在这个过程,有一个很重要的步骤,就是进行记忆
在字典中出现字母的次数,这就要求在标记的时候做点手脚,将走过的次数也记录下来,你如果不懂我在说什么,下面是各个变量
的含义:
pass【maxn】:记录建立过程中每个字母的个数;
trie【maxn】【26】:记录走过还是没走,同时对他进行递增赋值来起到换行的目的;
cur:行;
代码:
#include<stdio.h>
#include<string.h>
#define maxn 400000
int trie[maxn][26];
int pass[maxn];
int main()
{
int i,j,len,cur,num,alloc=1;
char str[10];
memset(trie,-1,sizeof(trie));
memset(pass,0,sizeof(pass));
while(gets(str),strlen(str)>0)
{
len=strlen(str);
cur=0;
for(i=0;i<len;i++)
{
if(trie[cur][str[i]-'a']==-1)
{
trie[cur][str[i]-'a']=alloc;
alloc++;
}
cur=trie[cur][str[i]-'a'];//
pass[cur]++;
}
}
while(gets(str))
{
len=strlen(str);
num=cur=0;
for(i=0;i<len;i++)
{
if(trie[cur][str[i]-'a']==-1)break;
cur=trie[cur][str[i]-'a'];
if(i==len-1)num=pass[cur];
}
printf("%d\n",num);
}
return 0;
}