Trie,又称字典树、单词查找树,是一种树形结构,用于保存大量的字符串,其核心思想是空间换时间。它的优点是:利用字符串的公共前缀来节约存储空间。
假设有b,abc,abd,bcd,abcd,efg,hii这6个单词,我们构建的树就是这样的
对于每一个节点,从根遍历到他的过程就是一个单词,如果这个节点被标记为红色,就表示这个单词存在,否则不存在。
那么,对于一个单词,我只要顺着他从跟走到对应的节点,再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色,就相当于插入了这个单词。
字典树的主要运用就是找单词的前缀。
下面直接贴出Trie模板
struct Trie
{
int cnt;//用来记录某个节点字符出现的子树
Trie *next[26];
Trie(){cnt = 0;
for(int i = 0 ; i < 26 ; i ++)
next[i] = NULL;
}
};
void insert(char *w,Trie *rt)
{
Trie *p = rt;
for(int i = 0 ; i < strlen(w) ; i ++)
{
if(p->next[w[i]-'a']) p->next[w[i]-'a']->cnt ++;
else if(p->next[w[i]-'a'] == NULL)
{
p->next[w[i]-'a'] = new Trie;
p->next[w[i]-'a']->cnt = 1;
}
p = p->next[w[i]-'a'];
}
}
int search(char *w,Trie *rt)
{
Trie *p = rt;
if(rt == NULL) return 0;
for(int i = 0 ; i < strlen(w); i ++)
{
if(p->next[w[i]-'a'])
p = p->next[w[i]-'a'];
else return 0;
}
return p->cnt;//返回有多少个单词是以w为前缀的
}
最短前缀,一般都是用字典树来求
carbohydrate carboh cart cart carburetor carbu caramel cara caribou cari carbonic carboni cartilage carti carbon carbon carriage carr carton carto car car carbonate carbona上面的单词,后面的就是其最短前缀
求最短前缀只需要略微修改search函数
void search(Trie *root,char *word)
{
Trie *rt = root;
if(rt == NULL) return ;
for(int i = 0 ; i < strlen(word) ; i ++)
{
int j = word[i] - 'a';
if(rt->next[j] == NULL) return;
printf("%c",word[i]);
if(rt->next[j]->cnt == 1) break;//关键就是这里,只要单词word的接下来一个字符在字典树的个数为1,那么其前面的字符集就是其最短前缀,道理很好懂
rt = rt->next[j];
}
}
POJ 2001就是求最短前缀