trie树
本篇随笔
浅析一下trie树。trie树也叫字典树,主要用于查找字符串是否出现过或是字符前缀的问题。Trie树顾名思义,是一棵树,每两个节点的边都代表一个字符。如图:
下面我说一下trie树的一些用法:
1.insert(存储) :
假设我们在trie树中插入单词"car" ,由根节点往下搜,由“c”到下标为1的节点,节点编号为1的节点,通过字符c到达节点编号为2的节点;节点编号为3的节点,通过字符r到达节点编号为4的节点。最后,在节点4打上一个标记,也就是说节点4是其中一个字符串的结束位置。
一般的,需要存下这个节点是多少个字符串的结束位置。
2.query(询问)
想出了存储的思路,其实查询也很好想了。沿着建树的节点,一个一个往下搜,当到达某个节点i,如果下一个字符是a,那么就看一下i通过a能到达哪一个节点。如果该节点为空,那么就直接返回当前答案(在搜索到每一个节点的时候,ans都要加上那个节点是多少个字符串的结束位置)。特殊的,如果查到了单词末尾,在trie树中仍没有越界,返回ans即可。
3. code: acwing 142 前缀统计
#include <bits/stdc++.h>
using namespace std;
const int N = 1000010;
int n, q, cnt[N], son[N][30], c = 0;
void insert (string str) { //插入一个字符串到Trie里
int q = 0;
for (int i = 0; i < str.size(); i++) {
int u = str[i] - 'a';
if (son[q][u] == 0) son[q][u] = ++c;
q = son[q][u];
}
cnt[q]++;
}
int query (string str) { //询问有多少个字符串是str的前缀
int q = 0, ans = 0;
for (int i = 0; i < str.size(); i++) {
int u = str[i] - 'a'; q = son[q][u];
if (q == 0) return ans;
ans += cnt[q];
}
return ans;
}
int main() {
scanf("%d%d", &n, &q);
string s;
for (int i = 1; i <= n; i++) cin >> s, insert(s);
for (int i = 1; i <= q; i++) cin >> s, printf("%d\n", query(s));
return 0;
}