字典树(trie)简介以及两种实现

字典树简介:

字典树(trie)是用来存储字符串集合的一种数据结构。

对于一个字符串构成的集合,最普通的存储方式是直接开一个数组存储,每个元素是一个字符串。而字典树则利用了不同字符串之间可能有相同前缀这一特点,节省了存储空间,同时在查询和插入时可以获得前缀相关的信息。一个典型的字典树如下图:


我们可以看到,每一个字符串对应了从根出发的一条路径。为了记录哪些路径才是真正在集合中的字符串,每个节点需要一个end标记,表示当前节点是否是一个字符串的终点。


字典树的实现:

一般来说字典树是一个有根树,每个点的儿子的数量是不确定的。在字符集为无穷集的情况下需要转化成一颗二叉树来实现。经典的转化方法是左儿子右兄弟转化(left-child right-sibling binary tree),如下图所示:


但是在一般情况下字符集是一个有限集,比如电话号码包含0-9,单词包含a-z。在空间允许的情况下可以直接开一个数组记录所有儿子。


实现方法一:静态数组

代码(来自POJ 3630):

/*
    PROG: POJ3630
    PROB: trie using array (fixed size dictionary)
*/

#include <cstdio>
#include <cstring>
using namespace std;

#define DEBUG 1
#define LOG(...) do { if (DEBUG) fprintf(stderr, __VA_ARGS__); } while(0)

#define MAXN 100005
int trie[MAXN][10], L;
char mark[MAXN], ans;
char buf[20];

void init(void) {
    L = 1;
    memset(trie, 0, sizeof(trie));
    memset(mark, 0, sizeof(mark));
    ans = true;
}

int main(void) {
    int Z; scanf("%d", &Z);
    while (Z--) {
        init();
        int n; scanf("%d", &n);
        for (int i = 0; i < n; ++i) {
            scanf("%s", buf);
            if (!ans) continue;
            int r = 0, t;
            for (int j = 0; buf[j]&&ans; ++j) {
                if (mark[r]) {
                    ans = false; break;
                }
                t = buf[j]-'0';
                if (!trie[r][t]) trie[r][t] = L++;
                r = trie[r][t];
            }
            for (int j = 0; j < 10; ++j)
                if (trie[r][j]) {
                    ans = false; break;
                }
            if (mark[r]) ans = false;
            mark[r] = 1;
        }
        if (ans) printf("YES\n");
        else printf("NO\n");
    }
    return 0;
}

这里数组trie[r][i]可以理解成一个函数trie(r, i),它表示节点r的第i个儿子(对应第i个字符)的位置(即下标)。插入时需要插入的字符串在trie中走过一条路径,r表示当前所走到的位置。trie[r][t]为0表示r节点还没有第i个儿子,于是在trie末尾新增节点,并将这个节点作为r的第t个儿子。L记录数组trie中下一个要加入的节点的位置。


实现方法二:利用vector

有时数据较大,使用静态数组可能导致MLE,这时可以用vector。

代码(来自HDU2328)

/*
    PROG: HDU2328
    PROB: trie
*/

#include <cstdio>
#include <cstring>
#include <vector>
#include <algorithm>
using namespace std;

#define DEBUG 1
#define LOG(...) do { if (DEBUG) fprintf(stderr, __VA_ARGS__); } while(0)

#define MAXN 4005
char P[MAXN][205];
char ans_buf[205];

struct Node {
    int next[26];
    int cnt, curr;
    Node() : cnt(0), curr(0) {
        memset(next, 0, sizeof(next));
    }
};

int main(void) {
    int N;
    while (scanf("%d", &N), N) {
        for (int i = 0; i < N; ++i)
            scanf("%s", P[i]);
        vector<Node> trie;
        trie.push_back(Node());
        int ans = 0;
        for (int k = 0; k < N; ++k) {
            for (int i = 0; P[k][i]; ++i) {
                int r = 0;
                for (int j = 0; P[k][i+j]; ++j) {
                    int x = P[k][i+j]-'a';
                    if (!trie[r].next[x]) {
                        trie[r].next[x] = trie.size();
                        trie.push_back(Node());
                    }
                    r = trie[r].next[x];
                    if (trie[r].cnt<k) break;
                    if (trie[r].curr<=k) {
                        trie[r].curr = k+1;
                        trie[r].cnt += 1;
                    }
                    if (k==N-1 && j+1 >= ans) {
                        bool flag = false;
                        if (j+1 > ans) flag = true;
                        else {
                            char tmp[205];
                            strncpy(tmp, P[k]+i, j+1);
                            tmp[j+1] = '\0';
                            if (strcmp(tmp, ans_buf)<0) flag = true;
                        }
                        if (flag) {
                            ans = j+1;
                            strncpy(ans_buf, P[k]+i, j+1);
                            ans_buf[j+1] = '\0';
                        }
                    }
                }
            }
        }
        if (ans) printf("%s\n", ans_buf);
        else printf("IDENTITY LOST\n");
    }
    return 0;
}
这里struct Node表示trie的一个结点,next[]是该节点各个儿子的位置。实现原理与静态数组时一样的,只是换成了vector,不需要提前预留足够内存。与指针实现相比,这种方法不需要手动释放内存。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Trie字典的Java代码实现可以分为以下几部分: 1. 定义Trie节点类,包含children数组和isEndOfWord标识,用于表示是否是单词的结尾。 2. 定义Trie类,包含插入、查找和删除操作。 3. 在Trie类中实现插入操作,遍历字符串每一个字符,在Trie中寻找对应节点,如果不存在则新建节点。 4. 在Trie类中实现查找操作,遍历字符串每一个字符,在Trie中寻找对应节点,如果找到最后一个字符对应的节点的isEndOfWord标识为true,则说明字符串是单词。 5. 在Trie类中实现删除操作,遍历字符串每一个字符,在Trie中寻找对应节点,如果找到最后一个字符对应的节点的isEndOfWord标识为true,则将其设为false,并删除空节点。 如果需要完整代码和注释请告诉我。 ### 回答2: Trie字典)是一种常用的数据结构,用于高效地存储和查找字符串。下面是Trie字典的Java代码实现,用于返回单词。 ```java class TrieNode { private TrieNode[] children; private boolean isEndOfWord; public TrieNode() { children = new TrieNode[26]; // 字母表的大小为26 isEndOfWord = false; } public void insert(String word) { TrieNode curr = this; for (char c : word.toCharArray()) { if (curr.children[c - 'a'] == null) { curr.children[c - 'a'] = new TrieNode(); } curr = curr.children[c - 'a']; } curr.isEndOfWord = true; } public boolean search(String word) { TrieNode node = searchPrefix(word); return node != null && node.isEndOfWord; } public boolean startsWith(String prefix) { TrieNode node = searchPrefix(prefix); return node != null; } private TrieNode searchPrefix(String prefix) { TrieNode curr = this; for (char c : prefix.toCharArray()) { if (curr.children[c - 'a'] == null) { return null; } curr = curr.children[c - 'a']; } return curr; } } public class Trie { private TrieNode root; public Trie() { root = new TrieNode(); } public void insert(String word) { root.insert(word); } public boolean search(String word) { return root.search(word); } public boolean startsWith(String prefix) { return root.startsWith(prefix); } } public class Main { public static void main(String[] args) { Trie trie = new Trie(); trie.insert("apple"); trie.insert("app"); System.out.println(trie.search("apple")); // 输出:true System.out.println(trie.startsWith("app")); // 输出:true System.out.println(trie.search("banana")); // 输出:false } } ``` 以上代码中,`TrieNode`表示Trie的节点,`Trie`表示Trie的结构。其中`TrieNode`类包含了插入单词、查找单词(完全匹配)以及查找前缀的功能。`Trie`类则是对外提供插入、查找单词和前缀的方法。 在`main`方法中,我们演示了如何使用`Trie`类来插入和查找单词。首先,我们插入了两个单词"apple"和"app"。然后分别调用`search`方法来查找"apple"和"banana",以及`startsWith`方法来查找以"app"开头的单词。最后,打印出对应的结果,即是否找到了对应的单词或前缀。 以上是Trie字典的Java代码实现,用于返回单词。 ### 回答3: Trie字典是一种经典的数据结构,用于高效地存储和查找字符串集合。下面是一个基于Java的Trie字典的代码实现,可以实现返回单词的功能: ```java class TrieNode { private final int ALPHABET_SIZE = 26; private TrieNode[] children; private boolean isEndOfWord; public TrieNode() { children = new TrieNode[ALPHABET_SIZE]; isEndOfWord = false; } } class Trie { private TrieNode root; public Trie() { root = new TrieNode(); } public void insert(String word) { TrieNode current = root; for (int i = 0; i < word.length(); i++) { char ch = word.charAt(i); int index = ch - 'a'; if (current.children[index] == null) { current.children[index] = new TrieNode(); } current = current.children[index]; } current.isEndOfWord = true; } public boolean search(String word) { TrieNode current = root; for (int i = 0; i < word.length(); i++) { char ch = word.charAt(i); int index = ch - 'a'; if (current.children[index] == null) { return false; } current = current.children[index]; } return current != null && current.isEndOfWord; } public List<String> getAllWords() { List<String> result = new ArrayList<>(); TrieNode current = root; StringBuilder sb = new StringBuilder(); getAllWordsUtil(current, sb, result); return result; } private void getAllWordsUtil(TrieNode node, StringBuilder sb, List<String> result) { if (node == null) { return; } if (node.isEndOfWord) { result.add(sb.toString()); } for (int i = 0; i < ALPHABET_SIZE; i++) { if (node.children[i] != null) { sb.append((char)('a' + i)); getAllWordsUtil(node.children[i], sb, result); sb.deleteCharAt(sb.length() - 1); } } } } public class Main { public static void main(String[] args) { Trie trie = new Trie(); String[] words = {"hello", "world", "java", "programming"}; for (String word : words) { trie.insert(word); } List<String> allWords = trie.getAllWords(); System.out.println("All words in trie: " + allWords); } } ``` 上述代码中,TrieNode类表示字典的节点,包括一个指向子节点的数组和一个标记,用于表示节点是否是某个单词的结尾。Trie类封装了字典的操作,包括插入单词、查找单词和返回所有单词的功能。在代码的主函数中,我们创建一个Trie对象并插入一些单词,然后调用getAllWords()方法返回字典中的所有单词。最后,打印出返回的单词列表。 希望以上解答对您有所帮助,如有更多疑问,请继续追问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值