目录
代码详解
构造二叉树结构
最先定义一个类来表示二叉树里面的节点,包含:位置key,值,左子树信息,右子树信息。
class BSTNode(object):
def __init__(self, key, value, left=None, right=None):
self.key, self.value, self.left, self.right = key, value, left, right
其中,默认left,right为None,表示它没有指向任何子树。
先初始化根节点:
class BST(object):
def __init__(self, root=None):
self.root = root
在定义构造函数,(二叉树的构建之前在二叉树用python实现里面已有记录,此处不再赘述)
def build_from(cls, node_list):
cls.size = 0
key_to_node_dict = {}
for node_dict in node_list:
key = node_dict['key']
key_to_node_dict[key] = BSTNode(key, value=key) # 这里值暂时用 和 key一样的
for node_dict in node_list:
key = node_dict['key']
node = key_to_node_dict[key]
if node_dict['is_root']:
root = node
node.left = key_to_node_dict.get(node_dict['left'])
node.right = key_to_node_dict.get(node_dict['right'])
cls.size += 1
return cls(root)
下面是BST的关键操作:
查找
如果查找一个指定key的关键节点呢?根据定义可以知道,每个内部节点左子树的key都比其对应的根节点小,右子树的key都比其对应的根节点大,所以,我们从根节点开始找,如果key的值比当前的值要小的话,就去它的左子树去找,否则去右子树去找,通过递归即可完成。
先定义一个辅助函数_bst_search(不会向外面暴露):
def _bst_search(self, subtree, key):
if subtree is None: # 没找到
return None
elif key < subtree.key:
return self._bst_search(subtree.left, key)
elif key > subtree.key:
return self._bst_search(subtree.right, key)
else:
return subtree
接下来定义取操作,先去找,找到的话放到node里面,并返回vallue值,每找到node返回None。
def get(self, key, default=None):
node = self._bst_search(self.root, key)
if node is None:
return default
else:
return node.value
实现in操作符
def __contains__(self, key):
"""实现 in 操作符"""
return self._bst_search(self.root, key) is not None
获取最小值节点
先定义辅助函数_bst_min_node,如果subtree是空的,就返回空,不断递归,如果subtree的左子树为空,说明已经找到了左子树的尽头,那就把这个树的值给返回。
def _bst_min_node(self, subtree):
if subtree is None:
return None
elif subtree.left is None: # 找到左子树的头
return subtree
else:
return self._bst_min_node(subtree.left)
那么,通过找到了,就把值赋给Node,并返回其value。
def bst_min(self):
node = self._bst_min_node(self.root)
return node.value if node else None
插入节点
要不断保持二叉树的特性,每个内部节点左子树的key都比它小,右子树的key都比它大。每次都当做叶子节点来插入,基本思路就是,插入节点的时候,如果当前节点为空, 就直接插入,如果key的值小于当前节点,就往左子树插,否则的话,就往右子树插。定义-bst_insert方法。
def _bst_insert(self, subtree, key, value):
""" 插入并且返回根节点
:param subtree:
:param key:
:param value:
"""
if subtree is None: # 插入的节点一定是根节点,包括 root 为空的情况
subtree = BSTNode(key, value)
elif key < subtree.key:
subtree.left = self._bst_insert(subtree.left, key, value)
elif key > subtree.key:
subtree.right = self._bst_insert(subtree.right, key, value)
return subtree
最后,根据辅助函数来定义add,这个分两种情况讨论,首先,去查找一下,有没有该节点,如果有的话就更新,把新的value赋给原先的value(False),如果没有,就插入(True)。
def add(self, key, value):
node = self._bst_search(self.root, key)
if node is not None: # 更新已经存在的 key
node.value = value
return False
else:
self.root = self._bst_insert(self.root, key, value)
self.size += 1
return True
删除节点
删除分三种情况:叶子节点,节点有一个孩子,节点有两个孩子。
那么要保证满足BST的性质的前提下:删除一个叶子节点的话,比较好办,只需要把它父亲指向它的节点给删除就行了。
那删除一个有一个孩子的节点呢?就需要把当前节点的父亲节点直接指向它的孩子就行。
那删除一个有两个孩子的节点呢?就比较巧妙了,先将key值中序遍历排列,然后,找到要删除点的逻辑前任和后继(就是其右子树的最小节点),那么把当前节点给删了,把后继节点给移动到当前位置,那么,二叉树的结构依旧保持着,没变化。
还是定义一个辅助函数_bst_remove,如果当前节点是None,就返回None。先查找,如果查找到了需要删除的节点,那么再分三种情况判断,如果左子树右子树都是none,那么直接返回None就行了(因为是递归结构,直接返回none,会在当前递归的递归出口将上一次递归,也就是它父亲节点指向它位置的key给置为none);如果左子树或者右子树有一个为none,就需要返回删除只有一个孩子的节点,只需要将subtree的孩子返回,并且,将其父亲节点指向它;如果左右子树都不为none,就需要查找后继节点并替换,查找右子树的最小值,并进行交换。交换后,把交换完的那个按第一种方式给删除掉就行了。
def _bst_remove(self, subtree, key):
"""删除节点并返回根节点"""
if subtree is None:
return None
elif key < subtree.key:
subtree.left = self._bst_remove(subtree.left, key)
return subtree
elif key > subtree.key:
subtree.right = self._bst_remove(subtree.right, key)
return subtree
else: # 找到了需要删除的节点
if subtree.left is None and subtree.right is None: # 叶节点,返回 None 把其父亲指向它的指针置为 None
return None
elif subtree.left is None or subtree.right is None: # 只有一个孩子
if subtree.left is not None:
return subtree.left # 返回它的孩子并让它的父亲指过去
else:
return subtree.right
else: # 俩孩子,寻找后继节点替换,并删除其右子树的后继节点,同时更新其右子树
successor_node = self._bst_min_node(subtree.right)
subtree.key, subtree.value = successor_node.key, successor_node.value
subtree.right = self._bst_remove(subtree.right, successor_node.key)
return subtree
最后写一个remove函数,将size每步减小,最后返回删除好的树。
def remove(self, key):
assert key in self
self.size -= 1
return self._bst_remove(self.root, key)
完整代码
# -*- coding: utf-8 -*-
class BSTNode(object):
def __init__(self, key, value, left=None, right=None):
self.key, self.value, self.left, self.right = key, value, left, right
class BST(object):
def __init__(self, root=None):
self.root = root
@classmethod
def build_from(cls, node_list):
cls.size = 0
key_to_node_dict = {}
for node_dict in node_list:
key = node_dict['key']
key_to_node_dict[key] = BSTNode(key, value=key) # 这里值暂时用 和 key一样的
for node_dict in node_list:
key = node_dict['key']
node = key_to_node_dict[key]
if node_dict['is_root']:
root = node
node.left = key_to_node_dict.get(node_dict['left'])
node.right = key_to_node_dict.get(node_dict['right'])
cls.size += 1
return cls(root)
def _bst_search(self, subtree, key):
if subtree is None: # 没找到
return None
elif key < subtree.key:
return self._bst_search(subtree.left, key)
elif key > subtree.key:
return self._bst_search(subtree.right, key)
else:
return subtree
def __contains__(self, key):
"""实现 in 操作符"""
return self._bst_search(self.root, key) is not None
def get(self, key, default=None):
node = self._bst_search(self.root, key)
if node is None:
return default
else:
return node.value
def _bst_min_node(self, subtree):
if subtree is None:
return None
elif subtree.left is None: # 找到左子树的头
return subtree
else:
return self._bst_min_node(subtree.left)
def bst_min(self):
node = self._bst_min_node(self.root)
return node.value if node else None
def _bst_insert(self, subtree, key, value):
""" 插入并且返回根节点
:param subtree:
:param key:
:param value:
"""
if subtree is None: # 插入的节点一定是根节点,包括 root 为空的情况
subtree = BSTNode(key, value)
elif key < subtree.key:
subtree.left = self._bst_insert(subtree.left, key, value)
elif key > subtree.key:
subtree.right = self._bst_insert(subtree.right, key, value)
return subtree
def add(self, key, value):
node = self._bst_search(self.root, key)
if node is not None: # 更新已经存在的 key
node.value = value
return False
else:
self.root = self._bst_insert(self.root, key, value)
self.size += 1
return True
def _bst_remove(self, subtree, key):
"""删除节点并返回根节点"""
if subtree is None:
return None
elif key < subtree.key:
subtree.left = self._bst_remove(subtree.left, key)
return subtree
elif key > subtree.key:
subtree.right = self._bst_remove(subtree.right, key)
return subtree
else: # 找到了需要删除的节点
if subtree.left is None and subtree.right is None: # 叶节点,返回 None 把其父亲指向它的指针置为 None
return None
elif subtree.left is None or subtree.right is None: # 只有一个孩子
if subtree.left is not None:
return subtree.left # 返回它的孩子并让它的父亲指过去
else:
return subtree.right
else: # 俩孩子,寻找后继节点替换,并删除其右子树的后继节点,同时更新其右子树
successor_node = self._bst_min_node(subtree.right)
subtree.key, subtree.value = successor_node.key, successor_node.value
subtree.right = self._bst_remove(subtree.right, successor_node.key)
return subtree
def remove(self, key):
assert key in self
self.size -= 1
return self._bst_remove(self.root, key)
NODE_LIST = [
{'key': 60, 'left': 12, 'right': 90, 'is_root': True},
{'key': 12, 'left': 4, 'right': 41, 'is_root': False},
{'key': 4, 'left': 1, 'right': None, 'is_root': False},
{'key': 1, 'left': None, 'right': None, 'is_root': False},
{'key': 41, 'left': 29, 'right': None, 'is_root': False},
{'key': 29, 'left': 23, 'right': 37, 'is_root': False},
{'key': 23, 'left': None, 'right': None, 'is_root': False},
{'key': 37, 'left': None, 'right': None, 'is_root': False},
{'key': 90, 'left': 71, 'right': 100, 'is_root': False},
{'key': 71, 'left': None, 'right': 84, 'is_root': False},
{'key': 100, 'left': None, 'right': None, 'is_root': False},
{'key': 84, 'left': None, 'right': None, 'is_root': False},
]
def test_bst_tree():
bst = BST.build_from(NODE_LIST)
for node_dict in NODE_LIST:
key = node_dict['key']
assert bst.get(key) == key
assert bst.size == len(NODE_LIST)
assert bst.get(-1) is None # 单例的 None 我们用 is 来比较
assert bst.bst_min() == 1
bst.add(0, 0)
assert bst.bst_min() == 0
bst.remove(12)
assert bst.get(12) is None
bst.remove(1)
assert bst.get(1) is None
bst.remove(29)
assert bst.get(29) is None