1. 问题描述:
Trie(发音类似 "try")或者说前缀树是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补完和拼写检查。
请你实现 Trie 类:
Trie() 初始化前缀树对象。
void insert(String word) 向前缀树中插入字符串 word 。
boolean search(String word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入);否则,返回 false 。
boolean startsWith(String prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true ;否则,返回 false 。
示例:
输入
["Trie", "insert", "search", "search", "startsWith", "insert", "search"]
[[], ["apple"], ["apple"], ["app"], ["app"], ["app"], ["app"]]
输出
[null, null, true, false, true, null, true]
解释:
Trie trie = new Trie();
trie.insert("apple");
trie.search("apple"); // 返回 True
trie.search("app"); // 返回 False
trie.startsWith("app"); // 返回 True
trie.insert("app");
trie.search("app"); // 返回 True
提示:
1 <= word.length, prefix.length <= 2000
word 和 prefix 仅由小写英文字母组成
insert、search 和 startsWith 调用次数总计不超过 3 * 10 ^ 4 次
2. 思路分析:
这道题目属于Trie树的模板题,Trie树是一种高效插入,检索字符串的树形数据结构,不同语言存储Trie树的孩子节点的数据结构是不同的,例如c/c++语言可以使用结构体来存储当前节点的孩子节点,因为使用的是python语言所以使用字典来存储相应的儿子节点,可以看成是多叉树,树的每一个分支为根节点的孩子,每个孩子都为一个字典,这样通过字典就可以链接所有字符之间的关系。一开始的时候初始化当前类对象的dic属性值为一个空字典,当插入单词的时候的时候是逐个字符进行插入的,判断当前字典中是否存在正在遍历的字符,如果不存在那么创建该字符对应的字典,并且走到当前的字符对应的孩子节点上,最后循环结束之后需要打上当前单词结束的一个标记这样在后面在Trie树中查找是否存在这样的单词的时候才可以通过这个标记进行判断。查找单词也是类似的,遍历当前的单词,判断是存在对应的孩子节点如果不存在那么直接返回False,否则走到孩子节点,最后判断是否是单词结束的标记。查找是否有对应的前缀与查找对应的单词是类似的,只是查找对应的前缀在找到对应的路径之后是直接返回True。下面是Trie树的结构:
3. 代码如下:
class Trie:
# python中可以使用字典来表示二子关系
def __init__(self):
self.dic = {}
def insert(self, word: str) -> None:
t = self.dic
for c in word:
if c not in t:
t[c] = {}
t = t[c]
# 最后打上一个当前单词的结束标记, 方便后面查找单词
t["end"] = 1
def search(self, word: str) -> bool:
t = self.dic
for c in word:
if c not in t:
return False
t = t[c]
return "end" in t
def startsWith(self, prefix: str) -> bool:
# 与查询单词的方法是类似的, 只是这里找到对应的路径之后直接返回True
t = self.dic
for c in prefix:
if c not in t:
return False
t = t[c]
return True
# if __name__ == '__main__':
# # 这道题目是Trie树的模板题, 与acwing中835题是一样的
# trie = Trie()
# trie.insert("abcde")
# trie.insert("sa")
# print(trie.search("abcde"))
# print(trie.search("abcd"))
# print(trie.startsWith("abcd"))