二叉树
1. 树
1.1 树的概念
树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
特点:
- 每个节点有零个或多个子节点;
- 没有父节点的节点称为根节点;
- 每一个非根节点有且只有一个父节点;
- 除了根节点外,每个子节点可以分为多个不相交的子树。
“树”这种数据结构真的很像我们现实生活中的“树”,这里面每个元素我们叫作“节点”;用来连线相邻节点之间的关系,我们叫作“父子关系”。
高度(Height)、深度(Depth)、层(Level):
节点的高度:节点到叶子节点的最长路径
节点的深度:根节点到这个节点所经历的边的个数
节点的层数:节点的深度+1
树的高度:根节点的高度
1.2 树的种类
无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
有序树:树中任意节点的子节点之间有顺序关系,这种树称为有序树;
- 二叉树:每个节点最多含有两个子树的树称为二叉树;
-
完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完全二叉树,其中满二叉树的定义是所有叶节点都在最底层的完全二叉树;
-
平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
-
排序二叉树(二叉查找树(英语:Binary Search Tree):也称二叉搜索树、有序二叉树);
-
霍夫曼树(用于信息编码):带权路径最短的二叉树称为哈夫曼树或最优二叉树;
B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子树。
1.3 二叉树
二叉树,顾名思义,每个节点最多有两个“叉”,也就是两个子节点,分别是左子节点和右子节点。不过,二叉树并不要求每个节点都有两个子节点,有的节点只有左子节点,有的节点只有右子节点。
叶子节点全都在最底层,除了叶子节点之外,每个节点都有左右两个子节点,这种二叉树就叫作满二叉树。
叶子节点都在最底下两层,最后一层的叶子节点都靠左排列,并且除了最后一层,其他层的节点个数都要达到最大,这种二叉树叫作完全二叉树。
1.4 树的存储与表示
顺序存储:将数据结构存储在固定的数组中,然在遍历速度上有一定的优势,但因所占空间比较大,是非主流二叉树。二叉树通常以链式存储。
链式存储:每个节点有三个字段,其中一个存储数据,另外两个是指向左右子节点的指针。我们只要拎住根节点,就可以通过左右子节点的指针,把整棵树都串起来。这种存储方式我们比较常用。大部分二叉树代码都是通过这种结构来实现的。
1.5 常见的一些树的应用场景
- xml,html等,那么编写这些东西的解析器的时候,不可避免用到树
- 路由协议就是使用了树的算法
- mysql数据库索引
- 文件系统的目录结构
- 很多经典的AI算法其实都是树搜索,此外机器学习中的decision tree也是树结构
2. 二叉树的实现与遍历
2.1 二叉树的节点表示以及树的创建
通过使用Node类中定义三个属性,分别为item本身的值,还有litem和ritem
class Node(object):
def __init__(self, item, litem=None, ritem=None):
self.item = item
self.litem = litem
self.ritem = ritem
树的创建,创建一个树的类,并给一个root根节点,一开始为空,随后添加节点
class Tree(object):
"""树类"""
def __init__(self, root=None):
self.root = root
def add(self, elem):
"""为树添加节点"""
node = Node(elem)
# 如果树是空的,则对根节点赋值
if self.root == None:
self.root = node
else:
queue = []
queue.append(self.root)
# 对已有的节点进行层次遍历
while queue:
# 弹出队列的第一个元素
cur = queue.pop(0)
if cur.litem == None:
cur.litem = node
return
elif cur.ritem == None:
cur.ritem = node
return
else:
# 如果左右子树都不为空,加入队列继续判断
queue.append(cur.litem)
queue.append(cur.ritem)
2.2 二叉树的遍历
树的遍历是树的一种重要的运算。所谓遍历是指对树中所有结点的信息的访问,即依次对树中每个结点访问一次且仅访问一次,我们把这种对所有节点的访问称为遍历(traversal)。那么树的两种重要的遍历模式是深度优先遍历和广度优先遍历,深度优先一般用递归,广度优先一般用队列。一般情况下能用递归实现的算法大部分也能用堆栈来实现。
深度优先遍历:
-
对于一颗二叉树,深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。
-
那么深度遍历有重要的三种方法。这三种方式常被用于访问树的节点,它们之间的不同在于访问每个节点的次序不同。这三种遍历分别叫做先序遍历(preorder),中序遍历(inorder)和后序遍历(postorder)。
-
先序遍历:在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,再递归使用先序遍历访问右子树。根节点->左子树->右子树
def preorder(self, node):
"""递归实现先序遍历"""
if node == None:
return
print(node.item, end=" ")
self.preorder(node.litem)
self.preorder(node.ritem)
- 中序遍历:在中序遍历中,我们递归使用中序遍历访问左子树,然后访问根节点,最后再递归使用中序遍历访问右子树。左子树->根节点->右子树
def inorder(self, node):
"""递归实中序遍历"""
if node == None:
return
self.inorder(node.litem)
print(node.item, end=" ")
self.inorder(node.ritem)
- 后序遍历:在后序遍历中,我们先递归使用后序遍历访问左子树和右子树,最后访问根节点。左子树->右子树->根节点
def postorder(self, node):
"""递归实现后序遍历"""
if node == None:
return
self.postorder(node.litem)
self.postorder(node.ritem)
print(node.item, end=" ")
广度优先遍历(层次遍历):
从树的root开始,从上到下从从左到右遍历整个树的节点
def breadth_travel(self):
"""利用队列实现树的层次遍历"""
if self.root == None:
return
queue = []
queue.append(self.root)
while queue:
node = queue.pop(0)
print(node.item)
if node.litem != None:
queue.append(node.litem)
if node.ritem != None:
queue.append(node.ritem)
3. 小结
其实这节课过后,我没怎么仔细的琢磨这个二叉树,上课虽然是听懂了,但现在感觉并不是太懂,在次之后我还要时不时的把课件拿出来看一看,复习复习,再把那些代码敲一遍,不然根本就不会牢牢的掌握的。