树与树算法
树的概念
树(Tree)是一种抽象数据结构类型或是实现这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。他是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一颗倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下特点:
- 每个节点有零个或多个字节点
- 没有父节点的节点称为根节点
- 每一个非根节点有且只有一个父节点
- 除了根节点意外,每个子节点可以分为多个不相交的子数
树的术语
- 节点的度:一个节点含有的子数的个数称为该节点的度;
- 树的度:一棵树中,最大的节点的度称为树的度
- 叶节点或终端节点:度为零的节点;
- 父亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
- 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;
- 兄弟节点:具有相同父节点的节点互称为兄弟节点;
- 节点的层次:从根开始定义起,跟为第一层,根的子节点为第二层,一次类推;
- 树的高度或深度:树中节点的最大层次;
- 堂兄弟节点:父节点在同一层的节点互为堂兄弟节点;
- 节点的祖先:从根到该节点所经分支上的所有节点;
- 子孙:以某节点为根的子树中任一节点都成为该节点的子孙;
- 森林:由m(m>=)棵互不相交的树的集合称为森林;
树的存储与表示
顺序存储:将数据结构存储在固定的数组中,然在遍历速度上有一定优势,但因所栈空间比较大,是非主流二叉树,二叉树通常以链式存储。
链式存储
常见的一些树的应用场景
- xml,html等,那么编写这些东西的解析器的时候,不可避免用到树
- 路由协议就是使用了树的算法
- mysql数据库索引
- 文件系统的目录结构
- 所以很多经典的AI算法都是树搜索,此外机器学习中的decision tree也是树结构
树的种类
-
无序树:树种任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
-
有序树:树中任意节点的子节点之间由顺序关系,这种树称为有序树;
-
二叉树:每个节点最多含有两个子数的树称为二叉树
- 完全二叉树:对于每一颗二叉树,假设深度为d(d>1)。除了第d层外,其他各层的节点数目均已达最大值,且第d层所有节点从做向右连续的紧密排列,这样的二叉树被称为完全二叉树,其中满二叉树的定义就是所有叶节点都在最底层的完全二叉树。
- 平衡二叉树(AVL树):当且仅当任何节点的两棵子数的高度差不大于1的二叉树。
- 排序二叉树(二叉查找树:Binary Search Tree):也称二叉搜索树、有序二叉树);
-
霍夫曼树(用于信息编码):带权路径最短的热茶书称为哈夫曼树或最优二叉树;
-
B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子数。
-
二叉树
二叉树的基本概念
二叉树是每个节点最多有两个子数的树结构。通常子树被称作"左子数"和“右子数”
二叉树的性质(特性)
性质1:在二叉树的第i层上之多有
2
i
−
1
2^{i-1}
2i−1个节点
性质2:深度为k的二叉树至多有$2^k-1个节点(k>0)
性质3:对于任意一棵二叉树,如果其叶节点树为N0,而度数为2的节点总数为N2,则N0=N2+1
性质4:具有n个节点的完全二叉树的深度必为log2(n+1)
性质5:完全二叉树,若从上至下、从左至右编号,则编号为i的结点,其左孩子编号必为2i,右孩子编号必为2i+1,其双亲的编号必为i/2(i=1时为根,除外)
二叉树的表示及实现
class Node:
def __init__(self, item):
self.elem = item
self.lchild = None
self.rchild = None
class Tree:
def __int__(self):
self.root = None
def add(self, item):
node = Node(item)
if self.root is None:
self.root = node
return
queue = [self.root]
while queue:
cur_node = queue.pop(0)
if cur_node.lchild is None:
cur_node.lchild = node
else:
queue.append(cur_node.lchild)
if cur_node.rchild is None:
cur_node.rchild = node
else:
queue.append(cur_node.rchild)
二叉树的遍历
树的遍历是树的一种重要的运算。所谓遍历时至对树中所有结点的信息的访问,即依次对树中每个结点访问一次且仅访问一次,我们把这种对所有结点的访问称为遍历。那么树的两种重要的遍历模式时深度优先遍历和广度优先遍历,深度优先一般用递归,广度优先一般用队列。一般情况下能用递归实现的算法大部分也能用堆栈来实现。
广度遍历
class Node:
def __init__(self, item):
self.elem = item
self.lchild = None
self.rchild = None
class Tree:
def __init__(self):
self.root = None
def add(self, item):
node = Node(item)
if self.root is None:
self.root = node
return
queue = [self.root]
while queue:
cur_node = queue.pop(0)
if cur_node.lchild is None:
cur_node.lchild = node
return
else:
queue.append(cur_node.lchild)
if cur_node.rchild is None:
cur_node.rchild = node
return
else:
queue.append(cur_node.rchild)
def breath_travel(self):
if self.root is None:
return
queue = [self.root]
while queue:
node = queue.pop(0)
print(node.elem)
if node.lchild is not None:
queue.append(node.lchild)
if node.rchild is not None:
queue.append(node.rchild)
if __name__ == '__main__':
tree = Tree()
tree.add(1)
tree.add(2)
tree.add(3)
tree.add(4)
tree.add(5)
tree.breath_travel()
深度优先遍历
对于一个二叉树,深度优先搜索时沿着树的深度遍历树的节点,尽可能深的搜索树的分支。
那么深度遍历右重要的三种方法。这三种方法常被用于访问树的节点,他们之间的不同在于访问每个节点的次序不同。这三种便可i分别叫做先序遍历(preorder),中序遍历(inorder)和后序遍历(postorder)。我们来给出它们的详细定义,然后距离看看它们的应用。
- 先序遍历,在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,在递归使用先序遍历访问右子数
根节点->左子树->右子树
def preorder(self,node):
'''先序遍历'''
if node is None:
return
print(node.elem,end=" ")
self.preorder(node.lchild)
self.preorder(node.rchild)
- 中序遍历 在中序遍历中,我们递归使用中序遍历访问左子树,然后访问根节点,最后在递归使用中序遍历访问右子树
左子树->根节点->右子树
def inorder(self,node):
'''中序遍历'''
if node is None:
return
self.inorder(node.lchild)
print(node.elem,end=" ")
self.inorder(node.rchild)
- 后序遍历 在后序遍历中,我们先递归使用后续遍历访问左子树和右子树,最后访问根节点
左子树->右子数->根节点
def postorder(self,node):
'''后续遍历'''
if node is None:
return
self.postorder(node.lchild)
self.postorder(node.rchild)
print(node.elem,end=" ")
由遍历确定一棵树
任意给定先序遍历和中序遍历、后序遍历和中序遍历,都可以还原一棵二叉树。