一、 树与树算法
1.1树的概念
树(tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:
每个节点有零个或多个子节点;
没有父节点的节点称为根节点;
每一个非根节点有且只有一个父节点;
除了根节点外,每个子节点可以分为多个不相交的子树;
比如说:
1.2 树的术语
节点的度:一个节点含有的子树的个数称为该节点的度;(看节点有几个子节点)
e.g 上图中节点B的度为3
树的度:一棵树中,最大的节点的度称为树的度;
e.g 上图中树的度为3
叶节点或终端节点:度为零的节点;(就是到头的节点)
e.g 上图中叶节点为K、J、F、L、O、P
父亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;(上一级)
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;(下一级)
兄弟节点:具有相同父节点的节点互称为兄弟节点;
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度:树中节点的最大层次;
堂兄弟节点:父节点在同一层的节点互为堂兄弟;
节点的祖先:从根到该节点所经分支上的所有节点;
子孙:以某节点为根的子树中任一节点都称为该节点的子孙。
森林:由m(m>=0)棵互不相交的树的集合称为森林;
1.3 树的种类
无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
有序树:树中任意节点的子节点之间有顺序关系,这种树称为有序树;
二叉树:每个节点最多含有两个子树的树称为二叉树;(上图不是二叉树)
完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完全二叉树,其中满二叉树的定义是所有叶节点都在最底层的完全二叉树;(除了最后一层,其他层数的节点都满了(2个子节点))
平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
排序二叉树(二叉查找树(英语:Binary Search Tree),也称二叉搜索树、有序二叉树);
霍夫曼树(用于信息编码):带权路径最短的二叉树称为哈夫曼树或最优二叉树;
B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子树。
1.4 树的存储与表示
顺序存储:
将数据结构存储在固定的数组中,然在遍历速度上有一定的优势,但因所占空间比较大,是非主流二叉树。二叉树通常以链式存储。
链式存储:
由于对节点的个数无法掌握,常见树的存储表示都转换成二叉树进行处理,子节点个数最多为2
常见的一些树的应用场景
1.xml,html等,那么编写这些东西的解析器的时候,不可避免用到树
2.路由协议就是使用了树的算法
3.mysql数据库索引
4.文件系统的目录结构
5.所以很多经典的AI算法其实都是树搜索,此外机器学习中的decision tree也是树结构
二、二叉树
2.1 二叉树的基本概念
二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)
2.2 二叉树的性质(特性)
性质1: 在二叉树的第i层上至多有2^(i-1)个结点(i>0)
性质2: 深度为k的二叉树至多有2^k - 1个结点(k>0)
性质3: 对于任意一棵二叉树,如果其叶结点数为N0,而度数为2的结点总数为N2,则N0=N2+1;
性质4:具有n个结点的完全二叉树的深度必为 log2(n+1)
性质5:对完全二叉树,若从上至下、从左至右编号,则编号为i 的结点,其左孩子编号必为2i,其右孩子编号必为2i+1;其双亲的编号必为i/2(i=1 时为根,除外)(见下面第二张图)
(1)完全二叉树——若设二叉树的高度为h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第h层有叶子结点,并且叶子结点都是从左到右依次排布,这就是完全二叉树:
附图1:
附图2:
(2)满二叉树——除了叶结点外每一个结点都有左右子叶且叶子结点都处在最底层的二叉树:
附图3:
2.3二叉树的节点表示以及树的创建(针对完全二叉树)
代码思路
以附图1为例,先找A,A满了,再找B,B满了,再找C,C满了,再找D,D满了, 再找E,发现E还少一个,所以补到E这边,这就是层次遍历(广度优先)
先是读A , 然后往后面添加A的左孩子B和右孩子C: A B C
再读B, 然后往后面添加B的左孩子D和右孩子E:A B C D E
再读C,然后往后面添加C的左孩子F和右孩子G:A B C D E F G
可以看出规律: 从左读,从右加,仔细一想,发现,这有点像队列(不明白队列的小伙伴可以看学习日记(五))!
queue[A], 从队列中取A,然后添加A的子节点B C:queue[B, C]
queue[B,C], 从队列中取B, 然后添加B的子节点D E:queue[C D E]
queue[C D E], 从队列中取C, 然后添加C的子节点F G:queue[D E F G]
代码实现
#树节点和链表的不同就在于因为二叉树不是一个连一个的,而是连了两个,所以在定义的时候有一个左孩子,有一个右孩子
class Node(object):
"""节点类"""
def __init__(self, elem=-1, lchild=None, rchild=None):
self.elem = elem
self.lchild = lchild
self.rchild = rchild
class Tree(object):
"""树类"""
def __init__(self, root=None):
self.root = root
def add(self,item):
"""为树添加节点"""
node = Node(elem)
#如果树是空的,则对根节点赋值
if self.root == None:
self.root = node
else:
queue = []
queue.append(self.root)
#对已有的节点进行层次遍历
while queue:
#弹出队列的第一个元素
cur = queue.pop(0)
if cur.lchild == None:
cur.lchild = node
return
elif cur.rchild == None:
cur.rchild = node
return
else:
#如果左右子树都不为空,加入队列继续判断
queue.append(cur.lchild)
queue.append(cur.rchild)
二叉树的遍历
层次遍历
(上面这段为层次遍历)
广度遍历(思路同上面add)
def breadth_travel(self, root):
"""利用队列实现树的层次遍历"""
if root == None:
return
queue = []
queue.append(root)
while queue:
node = queue.pop(0)
print node.elem,
if node.lchild != None:
queue.append(node.lchild)
if node.rchild != None:
queue.append(node.rchild)
深度遍历
介绍
分为三种: 先序遍历、中序遍历、后序遍历
先序遍历顺序:根节点->左子树->右子树
根据根节点->左子树->右子树的顺序,上面这颗大树先输出根节点0,然后看左子树,再看右子树
上图中,看左子树,按照根节点->左子树->右子树的顺序,先输出根节点1,然后看1的左子树和右字数,下面先看1的左子树
上图左下角红圈为1的左子树,按照根节点->左子树->右子树的顺序,输出3、7、8,然后再看回1的右子树
1的右子树按照根节点->左子树->右子树的顺序,输出4、9,然后在看回0的右子树,按照根节点->左子树->右子树的顺序,输出2、5、6
所以最后输出序列为:0 1 3 7 8 4 9 2 5 6
ps: 层次遍历输出序列为:0 1 2 3 4 5 6 7 8 9
中序遍历顺序 : 左子树->根节点->右子树
类似的分析过程,可以得出,中序遍历的输出序列为: 7 3 8 1 9 4 0 5 2 6
后序遍历顺序 : 左子树->右子树->根节点
类似的分析过程,可以得出,后序遍历的输出序列为: 7 8 3 9 4 1 5 6 2 0
代码实现
(递归,递归条件)
- 先序遍历
def preorder(self, root):
"""递归实现先序遍历"""
if root == None:
return
print root.elem
self.preorder(root.lchild)
self.preorder(root.rchild)
- 中序遍历
def inorder(self, root):
"""递归实现中序遍历"""
if root == None:
return
self.inorder(root.lchild)
print root.elem
self.inorder(root.rchild)
- 后序遍历
def postorder(self, root):
"""递归实现后续遍历"""
if root == None:
return
self.postorder(root.lchild)
self.postorder(root.rchild)
print root.elem
2.4 现在,我们来写个简单题目开心一下吧!
已知某二叉树的先序遍历为:0 1 3 7 8 4 9 2 5 6 ;
中序遍历为: 7 3 8 1 9 4 0 5 2 6
画出该树
答案可以私信博主或在评论区留言