做过分词或者文本分析的应该都知道double-array trie,基于《An Efficient Implementation of Trie Structures》实现,本来想完整的翻译成中文,但是翻译一段以后发现效果不好,英文翻译水平和中文表达能力有有待提高啊。基本用法
DoubleArrayTrie doubleArrayTrie = new DoubleArrayTrie();
// 向trie中添加单词
doubleArrayTrie.add("java");
doubleArrayTrie.add("javascript");
doubleArrayTrie.add("php");
doubleArrayTrie.add("phper");
// 查找
doubleArrayTrie.contains("java"); // true
doubleArrayTrie.contains("java程序员"); // false
// 内存使用量估计
long ramUsedMB=doubleArrayTrie.ramUsedMB();
github地址:https://github.com/wuda0112/common-utils/blob/master/src/main/java/com/wuda/tree/DoubleArrayTrie.java
本文介绍了一种高效的字典树(DoubleArray Trie)实现方式,该数据结构源自论文《An Efficient Implementation of Trie Structures》。文章展示了如何通过DoubleArray Trie进行词汇添加与查找,并提供了内存占用情况的评估方法。

9770

被折叠的 条评论
为什么被折叠?



