Python 面向对象编程 + 基本数据结构实现【part 3】:Trie 字典树
字典树
注: 这些代码能够通过 Leetcode 208. 实现 Trie (前缀树) 这道题。
字典树是一种树状抽象数据结构,能够存储一系列字符串,在 O ( N ) O(N) O(N) 时间内插入及读取一个单词。
对于英文的前缀字典树的每个节点,最多有
26
26
26 个可能的子节点。同时要考虑到前缀相同,但单词长度不同的情况:比如 “apple” 和 “apples” 。因此引入一个 “//” 来表示这个单词的结尾。因此一共有
27
27
27 个可能的结果。这个数据量显然用哈希( dict()
)这个数据结构来存储后继效率更高。
每个结点的定义如下:
class TreeNode(object):
def __init__(self, Char):
self.char = Char
self.children = dict()
在每个结点的 children
中的存储结构是这样的:
" a " → { " a " : p A , " b " : p B , ⋯ } "a"\rightarrow \{"a":p_A, "b":p_B,\cdots\} "a"→{"a":pA,"b":pB,⋯}
其中 p A p_A pA 是指向下一个 a a a 节点的指针。
字典树的插入
思路很简单:
- 如果当前节点的字典中,没有下一个字符的节点,则插入;
- 否则,则步入下一个节点,对下一个字符进行搜索,直到搜索到队尾标识符
\\
。
单词的查找
- 如果当前指针的字典中有下一个字符,则往该子节点节点搜索。
- 否则,则
return False
。
根据前缀查找是否有后继
思路于单词的查找相似,这里不赘述了。
代码实现
class TreeNode(object):
def __init__(self, Char):
self.char = Char
self.children = dict()
class Trie(object):
def __init__(self):
self.root = TreeNode("Tree Root")
def insert(self, word):
word = word + "\\"
cur = self.root
for i in word:
if i not in cur.children.keys():
cur.children[i] = TreeNode(i)
cur = cur.children[i]
def search(self, word):
word = word + "\\"
cur = self.root
for i in word:
if i in cur.children.keys():
cur = cur.children[i]
else:
return False
return True
def startsWith(self, prefix):
cur = self.root
for i in prefix:
if i in cur.children.keys():
cur = cur.children[i]
else:
return False
return True
if __name__ == "__main__":
obj = Trie()
words = ["apple", "app", "appl"]
for word in words:
obj.insert(word)
param_2 = obj.search("ap")
print(param_2)
prefix = "apple"
param_3 = obj.startsWith(prefix)
print(param_3)
结果验证:
对于上述几个单词构建的 歪脖子 字典树为:
>>> False
>>> True
符合我们的预期。