1、基本概念
字典树,又称为单词查找树,Tire数,是一种树形结构,它是一种哈希树的变种。
2、基本性质
根节点不包含字符,除根节点外的每一个子节点都包含一个字符
从根节点到某一节点。路径上经过的字符连接起来,就是该节点对应的字符串,每个节点的所有子节点包含的字符都不相同
3、应用场景
典型应用是用于统计,排序和保存大量的字符串(不仅限于字符串),经常被搜索引擎系统用于文本词频统计。
4、优点
利用字符串的公共前缀来减少查询时间,最大限度的减少无谓的字符串比较,查询效率比哈希树高。能够高效的存储和查找字符串。
举例:
下图中存储abcdef,abdef,aced,bcdf,bcff,cdaa,abc等几个字符串,且在每个字符串结尾处打上标记。
例题模板如下:
#include <iostream>
using namespace std;
const int N = 100010;
// son[][]存储树中每个节点的子节点,由于这里都是小写字母,所以26个
// cnt[]存储以每个节点结尾的单词数量
// idt表示数组的下标,下标是0的点,既是根节点又是空节点。
int son[N][26], cnt[N], idt;
void insert(char str[])
{
int p = 0;
for(int i = 0; str[i]; i ++)
{
int u = str[i] - 'a';
if (!son[p][u]) son[p][u] = ++ idt;
p = son[p][u];
}
cnt[p] ++;
}
int query(char str[])
{
int p = 0;
for(int i = 0; str[i]; i++)
{
int u = str[i] - 'a';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
int main()
{
int m;
scanf("%d", &m);
char opt[2];
char str[N];
while(m --)
{
scanf("%s%s", opt, str);
if (opt[0] == 'I')
{
insert(str);
}
else if (opt[0] == 'Q')
{
printf("%d\n", query(str));
}
}
return 0;
}