Trie模板:统计难题
题目描述
Lgnatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀)。
输入输出格式
输入格式:
输入数据的第一部分是一张单词表(不超过10^4个单词),每行一个单词,单词的长度不超过10,它们代表的是老师交给Lgnatius统计的单词。
接下来一个空行,代表单词表的结束。
接下来是一连串的提问,每行一个提问,每个提问都是一个字符串(不超过10^4个提问串)。
输出格式:
对于每个提问,给出以该字符串为前缀的单词的数量。
输入输出样例
输入样例#1:
banana
band
bee
absolute
acm
ba
b
band
abc
输出样例#1:
2
3
1
0
算法:字典树trie树
本质:一种用于实现字符串快速检索的多叉树结构
复杂度:总字符个数+(每次查询)查询字符串长度
基本性质:
1.根节点不包含字符,其余每个点只包含一个字符
2.从根节点到某一节点,路径上的字符连接起来,即为对应字符串
3.每个节点的所有子节点包含的字符都不相同
流程:
1.存储字典树,trie数组保存字符对应节点编号,从根节点开始扫描,不同就新建节点,在字符串结束更新判断字符串的b数组,便于查找字符串结束位置
2. 检索,令指针p指向根节点,扫描字符串中每一个字符。若指向空,则不存在。若指向合法编号,p赋值后继续扫描。扫描完成且作为末尾,则存在此字符串,否则不存在。
代码:
#include<bits/stdc++.h>
using namespace std;
char str[20];
int trie[1000000][26];
int sum[1000000];
int tot;
bool b[1000000]={};
void build(char *s)
{
int len=strlen(s);
int p=0;
for(int i=0;i<len;i++)
{
if(!trie[p][s[i]-'a']) trie[p][s[i]-'a']=++tot;
p=trie[p][s[i]-'a'];
sum[p]++;
}
b[p]=1;
}
int go(char *s)
{
int len=strlen(s);
int p=0;
for(int i=0;i<strlen(s);i++)
{
if(!trie[p][s[i]-'a']) return 0;
p=trie[p][s[i]-'a'];
}
return sum[p];
}
int main()
{
while(gets(str)&&str[0]!='\0') build(str);
while(scanf("%s",str)!=EOF)
{
printf("%d\n",go(str));
}
return 0;
}