数据结构笔记---树与二叉树_二叉树与树笔记-CSDN博客

本文链接：https://blog.csdn.net/qq_39716563/article/details/106516221

数据结构笔记

五、树与二叉树

五、树与二叉树

1. 树的基本概念

1.1 树的定义

树是n个结点的优先级。当n=0时，称为空树。任意非空树应该满足：

有且只有一个特定的称为根的结点
当n>1时，其余节点可分为m(m>0)个互不相交的有限集 $T_1$ 、 $T_2$ 、 $T_3$ … $T_m$ ，其中每个集合本身又是一个树，并且称为根的子树。

树的定义是递归的，即在树的定义中有用到了其自身，所以树是一种递归的数据结构。树作为一种逻辑结构，同时也是分层结构，具有以下特点：

树的根结点没有前驱，除根结点外的所有节点有且只有一个前驱。
树中所有结点可以有0个或者多个后继。

树中的某个结点(除根结点外)最多只和上一层的一个结点(父节点)有直接关系，根结点没有直接上层结点，所以n个结点的树有n-1条边。树中每个节点与下一层的0个或者多个结点(子女结点)有直接关系。

1.2 基本术语

在这里插入图片描述

祖先结点：根结点到某结点的唯一路径上的任意结点。A、B是E的祖先。
子孙结点：从某结点出发，其所有路径上的所有结点都是该结点的子孙结点。E是A、B的子孙。
双亲结点(父节点)：一个结点的直接前驱结点。B是E的双亲结点。
孩子结点：一个结点的直接后继。E是B的孩子结点。
兄弟结点：有相同双亲的结点称为兄弟结点。E、F是兄弟结点。
堂兄弟结点：双亲在同一层的结点互为堂兄弟。E、F、G、H、I、J是堂兄弟结点。

路径：树的两个结点之间所经过结点序列，树的分支是有方向的，即从双亲到孩子(从上到下)，所以同一双亲的两个孩子之间不存在路径。
路径长度：路径上所经过的边的个数。
树的路径长度：从树的根结点到每个结点的路径长度的总和。

树与结点的属性：

结点的深度：自根结点开始自顶向下逐层累加。
结点的高度：自叶结点开始自底向上逐层累加。
树的高度(深度)：树中结点的最大层数。
结点的度：有几个孩子(分支)。
树的度：各结点的度的最大值。
分支结点(非终端结点)：度大于0的结点。
叶子结点(终端结点)：度为0的结点。

有序树和无序树：

有序树：逻辑上看，树中结点的各子树从左到右是有次序的，不能互换。
无序树：逻辑上看，树中结点的各子树从左到右树无次序的，可以互换。

森林：森林是m(m>=0)棵互不相交的树的集合，特别地，m为0为空森林。

1.3 树的性质

性质1：结点数=总度数+1.
性质2：度为m的树中第i层上至多有 $m^{i-1}$ 个结点(i>=1)。
性质3：高度为h的m叉树至多有 $\frac{m^h-1}{m-1}$ 个结点，至少有h个结点。高度为h的度为m的树至多有 $\frac{m^h-1}{m-1}$ 个结点，至少有h+m-1个结点。
性质4：具有n个结点的m叉树的最小高度为[ $log_m(n(m-1)+1)$ ]。

注意：度为m的树，m叉树的区别：
二者都要满足任意结点的度<=m，即最多m个孩子。但是前者至少需要一个结点的度为m，后者允许所有结点的度都<m。前者一定是非空树，至少m-1个结点，后者可以是空树。

在这里插入图片描述

2. 二叉树的概念

2.1 二叉树的定义及其主要特性

在这里插入图片描述

2.1.1 二叉树的定义

二叉树是n(n>=0)个结点的有限集合：

或者为空二叉树，n=0。
或者由一个根结点和两个互不相交的被称为根的左子树和右子树组成。左子树和右子树又分别是一棵二叉树。

特点：

每个结点至多只有两个子树。
左右子树不能颠倒(二叉树是有序树)

二叉树的五种状态：

空二叉树
只有左子树
只有右子树
只有根节点
左右子树都有

2.1.2 几种特殊的二叉树

满二叉树：一棵高度为h，且含有 $2^h-1$ 个结点的二叉树
在这里插入图片描述
特点：

只有最后一层有叶子结点。
不存在度为1的结点。
按层序从1开始编号，结点i的左孩子为2i，右孩子为2i+1，结点i的父节点为[i/2] (假设存在)

完全二叉树：当且仅当其每个结点都与高度为h的满二叉树中编号为1-n的结点一一对应时称为完全二叉树。
在这里插入图片描述 特点：

只有最后两层可能有叶子结点。
最多有一个度为1的结点。
按层序从1开始编号，结点i的左孩子为2i，右孩子为2i+1，结点i的父节点为[i/2] (假设存在)
i<=[n/2]为分支结点，i>[n/2]为叶子结点。

二叉排序树：一个空二叉树或者是具有以下性质的二叉树：

左子树上的所有结点的关键字均小于根结点的关键字；
右子树上的所有结点的关键字均大于根结点的关键字；
左子树右子树又各是一棵二叉排序树。

在这里插入图片描述
二叉排序树：树上任意一个结点的左子树和右子树的深度之差不超过1。

2.1.3 二叉树的性质

性质一：设非空二叉树中度为0、1和2的结点个数分别是 $n_0$ 、 $n_1$ 、 $n_2$ ，则 $n_0$ = $n_2$ +1(叶子结点比二分之结点多一个)

推导过程：
假设树中结点的总数为n，则
①n= $n_0$ + $n_1$ + $n_2$
②n= $n_1$ +2 $n_2$ +1 (树的结点数=总度数+1)

再由②-①得： $n_0$ = $n_2$ +1
性质二：二叉树中第i层上至多有 $2^{i-1}$ 个结点(i>=1)
m叉树中第i层上至多有 $m^{i-1}$ 个结点(i>=1)
性质三：高度为h的二叉树至多有 $2^h-1$ 个结点。
高度为h的m叉树至多有 $\frac{m^h-1}{m-1}$ 个结点。
性质四：具有n(n>0)个结点的完全二叉树的高度h为[ $log_2(n+1)$ ] 或者 [ $log_2(n)$ ]+1 。
性质五：对于完全二叉树，设度为0、1、2的结点分别为 $n_0$ 、 $n_1$ 、 $n_2$
①若完全二叉树有2k(偶数)个结点，则必有 $n_1$ =1， $n_0$ =k， $n_2$ =k-1。
②若完全二叉树有2k+1(奇数)个结点，则必有 $n_1$ =0， $n_0$ =k， $n_2$ =k-1。

推导过程：
设结点总数为n，则可知n= $n_0$ + $n_1$ + $n_2$ ，且完全二叉树至多只有1个结点，所以可知 $n_1$ =1或者 $n_1$ =0。
由性质一可知： $n_0$ = $n_2$ +1，两边同时加 $n_2$ 可得： $n_0$ + $n_2$ =2 $n_2$ +1
易知： $n_0$ + $n_2$ 一定为奇数。
所以可得结论，当一共有偶数(2k)个结点时，为了使得 $n_0$ + $n_1$ + $n_2$ 为偶数， $n_1$ 必为奇数，所以 $n_1$ =1。
再得将 $n_0$ = $n_2$ +1代入2k= $n_0$ + $n_1$ + $n_2$ ，可得 $n_2$ =k-1, $n_0$ =k。
综上所述，若完全二叉树有2k(偶数)个结点，则必有 $n_1$ =1， $n_0$ =k， $n_2$ =k-1。

所以亦可得结论，当一共有奇数(2k+1)个结点时，为了使得 $n_0$ + $n_1$ + $n_2$ 为奇数， $n_1$ 必为偶数，所以 $n_1$ =0。
再得将 $n_0$ = $n_2$ +1代入2k+1= $n_0$ + $n_1$ + $n_2$ ，可得 $n_2$ =k, $n_0$ =k。
综上所述，若完全二叉树有2k+1(奇数)个结点，则必有 $n_1$ =1， $n_0$ =k， $n_2$ =k。

2.2 二叉树的存储结构

2.2.1 顺序存储结构

顺序存储：指用一组连续的存储单元依次自上而下、自左而右存储完全二叉树上的结点元素。

在这里插入图片描述
ps:让第一个位置空缺，保证数组小标与结点编号一致。

二叉树的顺序存储结构只适合存储完全二叉树，当高度为h且只有h个结点的单支树(所有结点都为右孩子)，顺序存储普通二叉树浪费空间太多，不做讨论。

在这里插入图片描述
当已知某个结点的序号为i是，可知：

i的左孩子为2i
i的右孩子为2i+1
i的父节点为i/2

结构体定义：

#define MaxSize 100 
struct TreeNode{
	int value;
	bool isEmpty;
};

初始化操作：

void InitTree(TreeNode t[MaxSize]){
	for(int i=0;i<MaxSize;i++){
		t[i].isEmpty=true;
	}
}

2.2.2 链式存储结构

链式存储：二叉链表至少包含三个域：数据域data，左指针域lchild、右指针域rchild。
在这里插入图片描述
重要结论：在含有n个结点的二叉链表中，含有n+1个空链域，经常利用空链域来组成另一种链表结构—线索链表。

结构体定义：

typedef struct BiTNode{
	int data ;
	struct BiTNode *lchild,*rchild;
}BiTNode,*BiTree;

插入根结点：

void InsertRootNode(BiTree root){
	root=(BiTree )malloc (sizeof(BiTNode));
	root->data=1;
	root->lchild=NULL;
	root->rchild=NULL;
}

三叉链表：数据域data，左孩子lchild，右孩子rchild，父结点指针*parent。

引入原因：查找某结点的父节点时，只能从根结点开始遍历查找。

typedef struct BiTNode{
	int data ;
	struct BiTNode *lchild,*rchild;
	struct BiTNode *parent;
}BiTNode,*BiTree;

3. 二叉树的遍历和线索二叉树

3.1 二叉树的遍历

3.1.1 先序遍历

先序遍历(PreOrder)过程：

若二叉树为空，则不进行遍历；否则，

访问根结点；
先序遍历左子树；
先序遍历右子树；

递归算法：

void PreOrder(BiTree T){
	if (T!=NULL){
		visit(T);
		PreOrder(T->lchild);
		PreOrder(T->rchild);
	}
}

在这里插入图片描述
先序遍历结果为：ABDGECF

3.1.2 中序遍历

中序遍历(InOrder)过程：

若二叉树为空，则不进行遍历；否则，

中序遍历左子树；
访问根结点；
中序遍历右子树；

递归算法：

void InOrder(BiTree T){
	if (T!=NULL){
		InOrder(T->lchild);
		visit(T);
		InOrder(T->rchild);
	}
}

在这里插入图片描述
中序遍历结果为：DGBEAFC

3.1.3 后序遍历

后序遍历(PostOrder)过程：

若二叉树为空，则不进行遍历；否则，

后序遍历左子树；
后序遍历右子树；
访问根结点；

递归算法：

void PostOrder(BiTree T){
	if (T!=NULL){
		PostOrder(T->lchild);
		PostOrder(T->rchild);
		visit(T);
	}
}

在这里插入图片描述 后序遍历结果为：GDEBFCA

注意：三种遍历算法的时间复杂度为O(n)，空间复杂度为O(n)

在这里插入图片描述
由上图可知：

先序遍历结果：-+a*b-cd/ef
中序遍历结果：a+b*c-d-e/f
后序遍历结果：abcd-*+ef/-

结合前面所学的栈在表达式中的应用：
先序遍历->前缀表达式
中序遍历->中缀表达式
后序遍历->后缀表达式

3.1.4 层次遍历

层次遍历： 按照树的层次顺序，对二叉树的各个结点进行访问。

算法思想：

初始化一个辅助队列。
根结点入队。
若队列为空，则队头结点出队，访问该结点，并将其左右孩子插入队尾(如果存在)。
重复3直到队列为空。

在这里插入图片描述
遍历序列为：ABCDEFGHIJKL

代码如下：

void LevelOrder(BiTree T){
	LinkQueue Q;
	InitQueue(Q);
	BiTree p;
	EnQueue(Q,T);
	while (!IsEmpty(Q)){
		DeQueue(Q,p);
		visit(p);
		if (p->lchild!=NULL){
			EnQueue(p->lchild);
		}
		if (p->rchild!=NULL){
			EnQueue(p->rchild);
		}
	}
}

3.1.5 由遍历序列构造二叉树

核心要义：一个遍历序列可能对应多种二叉树形态

case1：已知前序、中序遍历序列

前序遍历序列->根结点
中序遍历序列->左右子树

若已知：前序遍历序列为DAEFBCHGI，中序遍历序列为EAFDHCBGI，求二叉树。

解答：由前序遍历序列可知根结点为D，再由中序遍历序列可知其左右子树分别为EAF、HCBGI。再由前序遍历得左子树根结点为A，右子树根结点为B。依次类推，可得二叉树为：
在这里插入图片描述

case2：已知后序、中序遍历序列

后序遍历序列->根结点
中序遍历序列->左右子树

若已知：后序遍历序列为EFAHCIGBD，中序遍历序列为EAFDHCBGI，求二叉树。

解答：由后序遍历序列可知根结点为D，再由中序遍历序列可知其左右子树分别为EAF、HCBGI。再由后序遍历得左子树根结点为A，右子树根结点为B。依次类推，可得二叉树为：

在这里插入图片描述
case3：已知层序、中序遍历序列

层序遍历序列->根结点
中序遍历序列->左右子树

若已知：层序遍历序列为DABEFCGHI，中序遍历序列为EAFDHCBGI，求二叉树。

解答：由层序遍历序列可知根结点为D，再由中序遍历序列可知其左右子树分别为EAF、HCBGI。再由层序遍历得左子树根结点为A，右子树根结点为B。依次类推，可得二叉树为：
在这里插入图片描述

3.2 线索二叉树

引入线索二叉树原因：若已知普通二叉树的某个结点，则不方便找到其前驱结点。必须从根结点开始遍历。

3.2.1 基本概念

若无左子树，令lchild指向其前驱结点；若无右子树，令rchild指向其后继结点。利用其n+1个空链域指向其前驱、后继结点。

结点结构：

lchild	ltag	data	rtag	rchild

附设标志域，含义：
$\begin{cases} 0& \text{lchild域指示结点的左孩子}\\ 1& \text{lchild域指示结点的前驱} \end{cases}$

$\begin{cases} 0& \text{rchild域指示结点的右孩子}\\ 1& \text{rchild域指示结点的后继} \end{cases}$

结构体定义：

typedef struct ThreadNode{
	int data;
	struct ThreadNode *lchild,*rchild;
	int ltag,rtag;
}ThreadNode,*ThreadTree;

线索链表：以上面这种结点结构构成的二叉链表座位二叉树的存储结构
线索：指向结点前驱和后继的指针
线索二叉树：加上线索的二叉树

3.2.2 中序线索二叉树

在这里插入图片描述
构造方法

附设pre指向刚刚访问过的结点，q指向正在访问的结点。
递归遍历，找到最深层左子树结点。
检查q的左指针是否为空，若为空将它指向pre，并设置ltag=1。 q->lchild=pre; q->ltag=1;
检查pre的右指针是否为空，若为空指向q，并设置rtag=1。 q->rchild=q;q->rtag=1;若不为空，则检索右结点。
找到与q结点相邻最近的叶子结点，并重复3,4操作，直到树遍历完成。
最后将最右结点的rtag设为1。

递归算法


void visit(ThreadNode *q){
	if (q->lchild==NULL){
		q->lchild=pre;
		q->ltag=1;
	}
	if (pre!=NULL&&pre->rchild==NULL){
		pre->rchild=q;
		pre->rtag=1;
	}
	pre=q;
}

void InThread(ThreadTree T){
	if (T!=NULL){
		InThread(T->lchild);
		visit(T);
		InThread(T->rchild);
	}
}

void CreateInThread(ThreadTree T){
	pre=NULL;
	if (T!=NULL){
		InThread(T);
		if (pre->rchild==NULL){
			pre->rtag=1;
		}
	}
}

遍历方法
找后继
在中序线索二叉树中找到指定结点p的中序后继结点next：

若p->rtag = = 1，则next=p->rchild
若p->rtag = = 0，则next=p的右子树中最左下的结点

代码实现

ThreadNode *FirstNode(ThreadNode *p){
	while (p->ltag==0){
		p=p->lchild;
	}
	return p;
}

ThreadNode *NextNode(ThreadNode *p){
	if (p->rtag==0){
		return FirstNode (p->rchild);
	}else return p->rchild;
}

找前驱
在中序线索二叉树中找到指定结点p的中序前驱结点pre：

若p->ltag = = 1，则pre=p->lchild
若p->ltag = = 0，则next=p的左子树中最右下的结点

代码实现

ThreadNode *LastNode(ThreadNode *p){
	while (p->rtag==0){
		p=p->lchild;
	}
	return p;
}

ThreadNode *PreNode(ThreadNode *p){
	if (p->ltag==0){
		return LastNode (p->lchild);
	}else return p->lchild;
}

3.2.3 先序线索二叉树

在这里插入图片描述
构造方法

附设pre指向刚刚访问过的结点，p指向正在访问的结点。
递归遍历，找到最深层左子树且ltag不能为1结点。
检查p的左指针是否为空，若为空将它指向pre，并设置ltag=1。 p->lchild=pre; p->ltag=1;
检查pre的右指针是否为空，若为空指向p，并设置rtag=1。 p->rchild=p;p->rtag=1;若不为空，则检索右结点。
找到与q结点相邻最近的叶子结点，并重复3,4操作，直到树遍历完成。
最后将最右结点的rtag设为1。

递归算法

void visit(ThreadNode *q){
	if (q->lchild==NULL){
		q->lchild=pre;
		q->ltag=1;
	}
	if (pre!=NULL&&pre->rchild==NULL){
		pre->rchild=q;
		pre->rtag=1;
	}
	pre=q;
}

void PreThread(ThreadTree T){
	if (T!=NULL){
		visit(T);
		if (T->ltag==0){
			PreThread(T->lchild);
		}
		PreThread(T->rchild);
	}
}

void CreatePreThread(ThreadTree T){
	pre=NULL;
	if (T!=NULL){
		PreThread(T);
		if (pre->rchild==NULL){
			pre->rtag=1;
		}
	}
}

遍历方法
找后继
在先序线索二叉树中找到指定结点p的先序后继结点next：

若p->rtag = = 1，则next=p->rchild
若p->rtag = = 0，若p有左孩子则为左孩子，没有左孩子则为右孩子

找前驱
在先序线索二叉树中找到指定结点p的先序前驱结点pre：

若p->ltag = = 1，则pre=p->lchild
若p->ltag = = 0，不能找到父结点则无法找到前驱结点。如果能找到父节点，分下列四种情况：
①p为左孩子，p的父结点是它的前驱
②p为右孩子且其左兄弟为空，p的父结点为其前驱
③p为右孩子且其左兄弟为空，p的前驱为左兄弟子树中最后一个被先序遍历的结点
④p是根结点，p没有先序前驱

3.2.4 后序线索二叉树

在这里插入图片描述
构造方法

附设pre指向刚刚访问过的结点，p指向正在访问的结点。
递归遍历，找到最深层左子。
检查p的左指针是否为空，若为空将它指向pre，并设置ltag=1。 p->lchild=pre; p->ltag=1;
检查pre的右指针是否为空，若为空指向p，并设置rtag=1。 p->rchild=p;p->rtag=1;若不为空，则检索右结点。
找到与q结点相邻最近的叶子结点，并重复3,4操作，直到树遍历完成。
最后将最右结点的rtag设为1。

递归算法

void visit(ThreadNode *q){
	if (q->lchild==NULL){
		q->lchild=pre;
		q->ltag=1;
	}
	if (pre!=NULL&&pre->rchild==NULL){
		pre->rchild=q;
		pre->rtag=1;
	}
	pre=q;
}

void PostThread(ThreadTree T){
	if (T!=NULL){
		PostThread(T->lchild);
		PostThread(T->rchild);
		visit(T);
	}
}

void CreatePostThread(ThreadTree T){
	pre=NULL;
	if (T!=NULL){
		PostThread(T);
		if (pre->rchild==NULL){
			pre->rtag=1;
		}
	}
}

遍历方法
找后继
在先序线索二叉树中找到指定结点p的先序后继结点next：

若p->rtag = = 1，则next=p->rchild
若p->rtag = = 0，不能找到父结点则无法找到前驱结点。如果能找到父节点，分下列四种情况：
①p为右孩子，p的父结点是它的后继
②p为左孩子且其右兄弟为空，p的父结点为其后继
③p为左孩子且其右兄弟为空，p的后继为右兄弟子树中最后一个被后序遍历的结点
④p是根结点，p没有后序前驱

找前驱
在先序线索二叉树中找到指定结点p的先序前驱结点pre：

若p->ltag = = 1，则pre=p->lchild
若p->ltag = = 0，分下列两种情况：
①p有右孩子，则p的右孩子为其后序前驱
②p没有右孩子，则p的左孩子为其后序前驱

4. 树与森林

4.1 树的存储结构

在这里插入图片描述

4.1.1 双亲表示法

连续数组存储每个结点
结点处附设伪指针，指示双亲在数组中的位置
根结点下标为0，其伪指针域为-1

在这里插入图片描述
优点：查找指定结点的双亲很方便。
缺点：查找指定结点的孩子结点只能从头遍历。

结构体定义：

#define MAX_TREE_SIZE 100

typedef struct {
	int data;
	int parent;
}PTNode;

typedef struct {
	PTNode nodes[MAX_TREE_SIZE];
	int n;
}PTree;

4.1.2 孩子表示法

将每个结点的都用单链表连接起来形成线性结构，n个结点就有n个孩子链表(叶子结点的孩子链表为空表)

在这里插入图片描述
优点：查找指定结点的孩子很方便。
缺点：查找指定结点的双亲不方便。

结构体定义：

struct CTNode{
	int child;
	struct CTNode *next;
};

typedef struct  {
	int data;
	struct CTNode *firstChild;
}CTBox;

typedef struct {
	CTBox node [MAX_TREE_SIZE];
	int n,r;
}CTree;

4.1.3 孩子兄弟表示法(二叉树表示法)

将二叉链表作为树的存储结构，每个结点包括三部分内容。

结点值
指向结点的第一个孩子的指针
指向结点下一个兄弟结点的指针

在这里插入图片描述
优点：可以转换为熟悉的二叉树再进行处理
缺点：从已知结点找其双亲结点比较麻烦

结构体定义：

typedef struct CSNode {
	int data ;
	struct CSNode *firstchild,*nextsibling;
}CSNode,*CSTree;

4.2 树、森林与二叉树的转化

本质：用二叉链表存储森林。

森林转化为二叉树的步骤：

将每一棵树根据孩子兄弟表示法转化为相应的二叉树。
将n+1棵树视为第n棵树的右子树。
直到全部遍历完所有树。

在这里插入图片描述

二叉树转化为森林的步骤：

找森林中的n个树根：二叉树的最右侧的n个结点数(含根结点)是n个树根结点
将被分出的每个二叉树按照"左孩子，右兄弟"的方法再画出剩余分支，直到每个树被处理

在这里插入图片描述

4.3 树与森林的遍历

4.3.1 树的先根遍历

遍历方法：若树非空，访问根结点，再依次访问每一个子树，按照这种方法遍历完整个树。最后得到的序列与对应二叉树的先序序列相同。

在这里插入图片描述
遍历序列：ABEKFCGDHIJ

4.3.2 树的后根遍历

遍历方法：若树非空，先访问每一个子树，再依次访问根结点，按照这种方法遍历完整个树。最后得到的序列与对应二叉树的先中序列相同。
在这里插入图片描述
遍历序列：KEFBGCHIJDA

4.3.3 树的层次遍历

遍历方法：

若树非空，则根结点入队
若队列非空，队头元素出队并访问，同时将该元素的孩子入队
重复2直至队列为空

在这里插入图片描述
遍历序列：ABCDEFGHIJK

4.3.4 森林的先序遍历

遍历步骤：

若森林非空，访问第一棵树的根结点。
先序遍历第一棵树中根结点的子树森林。
先序遍历除去第一棵树之后剩余的树构成的森林。

在这里插入图片描述
遍历序列：BEKLFCGDHMIJ

效果等同于对每个树进行先根遍历，或者是将森林转换为与之对应的二叉树，再对二叉树进行先序遍历。

4.3.4 森林的中序遍历

遍历步骤：

中序遍历第一棵树中根结点的子树森林。
中序遍历除去第一棵树之后剩余的树构成的森林。

在这里插入图片描述
遍历序列：KLEFBGCMHIJD

效果等同于对每个树进行后根遍历，或者是将森林转换为与之对应的二叉树，再对二叉树进行中序遍历。

5. 树与二叉树的应用

5.1 二叉排序树

5.1.1 二叉排序树的定义

二叉排序树(二叉查找树)或者是一棵空树，或者是具有以下特性的二叉树：

若左子树非空，则左子树上所有结点的值均小于根结点的值。
若右子树非空，则右子树上所有结点的值均大于根结点的值。
左子树右子树又各是一棵二叉排序树。

在这里插入图片描述
对二叉树进行中序遍历可以得到一个递增的有序序列：1、3、4、6、7、8、10、13、14

5.1.2 二叉排序树的查找

查找方法：

若树非空，则目标值与根结点的值进行比较。
若相等则查找成功，若小于根结点的值则在左子树上查找，否则在右子树上查找。
查找成功，返回结点指针，查找失败返回NULL。

结构体定义：

typedef struct BSTNode {
	int key;
	struct BSTNode *lchild,*rchild;
}BSTNode ,*BSTree;

查找代码：

BSTNode *BST_Search(BSTree T,int key){
	while (T!=NULL && key!=T->key){
		if (key<T->key){
			T=T->lchild;
		}else {
			T=T->rchild;
		}
	}
	return T;
}

5.1.3 二叉排序树的插入

插入方法： 若二叉树非空则直接插入根结点；否则，k小于根结点插入左子树，k大于根结点的值插入右子树。

插入代码：

int BST_Insert(BSTree &T,int k){
	if (T==NULL){
		T=(BSTree)malloc (sizeof (BSTNode));
		T->key=k;
		T->lchild=T->rchild=NULL;
		return 1;
	}
	else if (k==T->key)
		return 0;
	else if (k<T->key)
		return BST_Insert(T->lchild,k);
	else if (k>T->key)
		return BST_Insert(T->rchild,k);
}

5.1.4 二叉排序树的构造

构造方法：

将序列的第一个值作为根结点。
从第二个值开始遍历，若值大于结点值则放插入右子树，若值小于结点值则放入左子树。
直到遍历完整个序列。

void Creat_BST(BSTree &T,int str[],int n){
	T=NULL;
	int i=0;
	while (i<n){
		BST_Insert(T,str[i]);
		i++;
	}
}

5.1.5 二叉排序树的删除

删除方法：
首先找到目标结点。

若目标结点是叶子结点，则直接删除，不会影响二叉树的性质。
若目标结点只有一棵左子树或者右子树，则让z的子树成为z父结点的子树，替代z的位置。
若目标结点有两个子树，则令z的中序遍历的直接前驱和直接后继替代z,然后从二叉排序树中删除这个直接后继(直接前驱)，这样就转换为第一种或者第二种情况了。

5.1.6 查找效率分析

查找长度：查找过程中，需要比对关键字的次数称为查找长度，反映了查找操作的时间复杂度。

平均查找长度ASL(Average Search Length)

在这里插入图片描述
查找成功ASL=(1x1+2x2+4x3+1x4)/8=2.625
查找失败ASL=(3x7+4x2)/9=3.22

在这里插入图片描述
查找成功ASL=(1x1+2x2+3x1+4x1+5x1+6x1+7x1)/8=3.75
查找失败ASL=(2x3+3x4+5x6+7x2)/9=4.22

查找成功最好情况：n个结点的二叉树最小高度为 $log_2n+1$ ,平均查找长度为：O( $log_2n$ )
最坏情况：每个结点只有一个分支，树高h=结点数n，平均查找长度为：O(n
)

5.2 平衡二叉树

5.2.1 平衡二叉树的定义

平衡二叉树(平衡树/AVL舒)：树上任意结点的左子树与右子树的高度之差不超过1.

结点的平衡因子：该结点的左子树高度-该结点的右子树高度

PS:平衡二叉树的每个结点的平衡因子值只可能是-1、0、1

在这里插入图片描述
结构体定义

typedef struct AVLNode {
	int key;
	int balance;
	struct AVLNode *lchild,*rchild;
}AVLNode,* AVLTree;

5.2.2 平衡二叉树的插入(旋转)

插入->不平衡->旋转

每次调整的对象都是最小的不平衡树。

旋转步骤：

先找最小不平衡树
区分四种情况
实施对应操作
处理左右孩子的中间的兄弟结点

LL平衡旋转

插入情形： 在结点的左孩子(L)的左子树(L)上插入了新的结点，并使得以这个结点为根结点的树成为最小不平衡子树。

旋转方法： 将结点的左孩子旋转为最小不平衡树的根结点，然后正常处理新结点的右子树即可。

RR平衡旋转

插入情形： 在结点的右孩子®的右子树( R)上插入了新的结点，并使得以这个结点为根结点的树成为最小不平衡子树。

旋转方法： 将结点的右孩子旋转为最小不平衡树的根结点，然后正常处理新结点的左子树即可。

LR平衡旋转

插入情形： 在根结点的左孩子(L)的右子树 ( R)上插入了新的结点，并使得以这个结点为根结点的树成为最小不平衡子树。

旋转方法： 先将根结点的右子树结点左上转为根结点的左孩子(左旋转)，再将根结点左孩子右上转为根结点(右旋转)，最后正常处理夹在根结点中间的子树。

RL平衡旋转

插入情形： 在根结点的右孩子®的左子树 ( L)上插入了新的结点，并使得以这个结点为根结点的树成为最小不平衡子树。

旋转方法： 先将根结点的右子树结点右上转为根结点的右孩子(右旋转)，再将根结点右孩子左上转为根结点(左旋转)，最后正常处理夹在根结点中间的子树。

5.2.3 平衡二叉树的查找

查找过程中，比较的次数不超过树的深度。
用 $n_h$ 表示深度为h的平衡树中含有的最少的结点数。
当h=0时，0个结点。
当h=1时，1个结点。
当h=2时，2个结点。
当h=3时，4个结点。

递推可得， $n_h$ = $n_{h-1}$ + $n_{h-2}$ +1
可以证明，含有n个结点的平衡二叉树的最大深度为O( $log_2n$ )
因此平衡二叉树的平均查找长度为O( $log_2n$ )

5.3 哈夫曼树与哈夫曼编码

5.3.1 哈夫曼树的定义

结点的权：结点上有现实含义的值
结点的带权路径长度：结点权值 x 树的根结点到该结点的路径长度
树的带权路径长度(WPL)：树中所有叶结点的带权路径长度之和。

$\sum_{i=1}^n w_il_i$

在这里插入图片描述
哈夫曼树：带权路径长度最小的二叉树称为哈夫曼树。

所以上图中第2、3棵树为哈夫曼树，也称为最优二叉树。

数据结构笔记---树与二叉树

数据结构笔记

五、树与二叉树

1. 树的基本概念

1.1 树的定义

1.2 基本术语

1.3 树的性质

2. 二叉树的概念

2.1 二叉树的定义及其主要特性

2.1.1 二叉树的定义

2.1.2 几种特殊的二叉树

2.1.3 二叉树的性质

2.2 二叉树的存储结构

2.2.1 顺序存储结构

2.2.2 链式存储结构

3. 二叉树的遍历和线索二叉树

3.1 二叉树的遍历

3.1.1 先序遍历

3.1.2 中序遍历

3.1.3 后序遍历

3.1.4 层次遍历

3.1.5 由遍历序列构造二叉树

3.2 线索二叉树

3.2.1 基本概念

3.2.2 中序线索二叉树

3.2.3 先序线索二叉树

3.2.4 后序线索二叉树

4. 树与森林

4.1 树的存储结构

4.1.1 双亲表示法

4.1.2 孩子表示法

4.1.3 孩子兄弟表示法(二叉树表示法)

4.2 树、森林与二叉树的转化

4.3 树与森林的遍历

4.3.1 树的先根遍历

4.3.2 树的后根遍历

4.3.3 树的层次遍历

4.3.4 森林的先序遍历

4.3.4 森林的中序遍历

5. 树与二叉树的应用

5.1 二叉排序树

5.1.1 二叉排序树的定义

5.1.2 二叉排序树的查找

5.1.3 二叉排序树的插入

5.1.4 二叉排序树的构造

5.1.5 二叉排序树的删除

5.1.6 查找效率分析

5.2 平衡二叉树

5.2.1 平衡二叉树的定义

5.2.2 平衡二叉树的插入(旋转)

LL平衡旋转

RR平衡旋转

LR平衡旋转

RL平衡旋转

5.2.3 平衡二叉树的查找

5.3 哈夫曼树与哈夫曼编码

5.3.1 哈夫曼树的定义

5.3.2 哈夫曼树的构造

5.3.3 哈夫曼编码