5.1树的逻辑结构
5.1.1树的定义和基本术语
1.树的定义:
n(n≥0)个结点的有限集合。当n=0时,称为空树;任意一棵非空树满足以下条件:
⑴有且仅有一个特定的称为根的结点;
⑵当n>1时,除根结点之外的其余结点被分成m(m>0)个互不相交的有限集合T1,T2,… ,Tm,其中每个集合又是一棵树,并称为这个根结点的子树。
2.树的基本术语
结点的度:结点所拥有的子树的个数。
树的度:树中各结点度的最大值。
叶子结点:度为0的结点,也称为终端结点。
分支结点:度不为0的结点,也称为非终端结点
孩子、双亲:树中某结点子树的根结点称为这个结点的孩子结点,这个结点称为它孩子结点的双亲结点;
兄弟:具有同一个双亲的孩子结点互称为兄弟。
路径:如果树的结点序列n1, n2, …, nk有如下关系:结点ni是ni+1的双亲(1<=i<k),则把n1, n2, …, nk称为一条由n1至nk的路径;
路径上经过的边的个数称为路径长度。
祖先、子孙:在树中,如果有一条路径从结点x到结点y,则x称为y的祖先,而y称为x的子孙。
结点所在层数:根结点的层数为1;对其余任何结点,若某结点在第k层,则其孩子结点在第k+1层。
树的深度:树中所有结点的最大层数,也称高度。
层序编号:将树中结点按照从上层到下层、同层从左到右的次序依次给他们编以从1开始的连续自然数。
有序树、无序树:如果一棵树中结点的各子树从左到右是有次序的,称这棵树为有序树;反之,称为无序树。
森林:m (m≥0)棵互不相交的树的集合。
5.1.2树的抽象数据类型定义
树的应用很广泛,在不同的实际应用中,树的基本操作不尽相同。下面给出一个树的抽象数据类型定义的例子,简单起见,基本操作只包含树的遍历,针对具体应用,需要重新定义其基本操作。
ADT Tree
Data
树是由一个根结点和若干棵子树构成,
树中结点具有相同数据类型及层次关系
Operation
InitTree
前置条件:树不存在
输入:无
功能:初始化一棵树
输出:无
后置条件:构造一个空树
DestroyTree
前置条件:树已存在
输入:无
功能:销毁一棵树
输出:无
后置条件:释放该树占用的存储空间
PreOrder
前置条件:树已存在
输入:无
功能:前序遍历树
输出:树的前序遍历序列
后置条件:树保持不变
PostOrder
前置条件:树已存在
输入:无
功能:后序遍历树
输出:树的后序遍历序列
后置条件:树保持不变
endADT
5.1.3树的遍历操作
树的遍历:
从
根
结点出发,按照某种
次
序访问
树中所有结点,使得每个结点被访问一次且仅被访问一次。
树的前序遍历操作定义为:
若树为空,则空操作返回;否则
⑴访问根结点;
⑵按照从左到右的顺序前序遍历根结点的每一棵子树。
树的后序遍历操作定义为:
若树为空,则空操作返回;否则
⑴按照从左到右的顺序后序遍历根结点的每一棵子树;
⑵访问根结点。
树的层序遍历操作定义为:
从树的第一层(即根结点)开始,自上而下逐层遍历,在同一层中,按从左到右的顺序对结点逐个访问。
5.2
树的存储结构
5.2.1双亲表示法
基本思想:
用一维数组来存储树的各个结点(一般按
层
序
存储),数组中的一个元素对应树中的一个结点,包括结点的数据信息以及该结点的双亲在数组中的下标。
data:
存储树中结点的数据信息
parent:
存储该结点的双亲在数组中的下标
template <class DataType>
struct PNode
{
DataType data; //
数据域
int parent; //
指针域,双亲在数组中的下标
} ;
树的双亲表示法实质上是一个静态链表。
5.2.2 孩子表示法
孩子链表的基本思想:
把每个结点的孩子排列起来,看成是一个线性表,且以单链表存储,则n个结点共有
n
个孩子链表
。这n 个单链表共有n 个头指针,
这 n 个头指针又组成了一个线性表,为了便于进行查找采用顺序存储。最后,将存放 n 个头指针的数组和存放n个结点的数组结合起来,构成孩子链表的
表头数组
。
5.2.3 双亲孩子表示法:是将双亲表示法和孩子链表表示法相结合的存储方法。
5.2.4孩子兄弟表示法
结点结构:
firstchild
|
data
|
|
data:数据域,存储该结点的数据信息;
firstchild:指针域,指向该结点第一个孩子;
rightsib:指针域,指向该结点的右兄弟结点。
template <class DataType>
{
DataType data;
TNode <DataType> *firstchild, *rightsib;
};
5.3二叉树的逻辑结构
二叉树的定义:
二叉树
是n(n≥0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵
互不相交
的、分别称为根结点的
左子树
和
右子树
的二叉树组成。
二叉树的特点 :
⑴每个结点最多有两棵子树;
⑵二叉树是有序的,其次序不能任意颠倒。
特殊的二叉树:
斜树
1 .所有结点都只有左子树的二叉树称为
左斜树
;
2 .所有结点都只有右子树的二叉树称为
右斜树
;
3.左斜树和右斜树统称为
斜树
。
满二叉树:
在一棵二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上。
完全二叉树 :
对一棵具有n个结点的二叉树按层序编号,如果编号为i(1≤i≤n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中的位置完全相同。
5.3.2 二叉树的基本性质
性质
5-1
二叉树的第
i
层上最多有
2
i
-
1
个结点(
i
≥
1
)。
性质
5-2
一棵深度为
k
的二叉树中,最多有
2
k
-
1
个结点,最少有
k
个结点。
性质
5-3
在一棵二叉树中,如果叶子结点数为
n
0
,度为
2
的结点数为
n
2
,则有
:
n
0
=
n
2
+
1
。
性质
5-4
具有
n
个结点的完全二叉树的深度为
log
2
n
+1
。
性质
5-5
对一棵具有
n
个结点的完全二叉树中从
1
开始按
层序编号,则对于任意的序号为
i
(
1
≤
i
≤
n
)的结点(简
称为结点
i
),有:
(
1
)如果
i
>
1
,则结点
i
的双亲结点的序号为
i
/2
;如果
i
=
1
,则结点
i
是根结点,无双亲结点。
(
2
)如果
2
i
≤
n
,则结点
i
的左孩子的序号为
2
i
;
如果
2
i
>
n
,则结点
i
无左孩子。
(
3
)如果
2
i
+1
≤
n
,则结点
i
的右孩子的序号为
2
i
+1
;如
果
2
i
+1
>
n
,则结点
i
无右孩子。
5.3.3二叉树的抽象数据类型定义
ADT BiTree
由一个根结点和两棵互不相交的左右子树构成,
结点具有相同数据类型及层次关系
Operation
InitBiTree
前置条件:无
输入:无
功能:初始化一棵二叉树
输出:无
后置条件:构造一个空的二叉树
DestroyBiTree
前置条件:二叉树已存在
输入:无
功能:销毁一棵二叉树
输出:无
后置条件:释放二叉树占用的存储空间
PreOrder
前置条件:二叉树已存在
输入:无
功能:前序遍历二叉树
输出:二叉树中结点的一个线性排列
后置条件:二叉树不变
InOrder
前置条件:二叉树已存在
输入:无
功能:中序遍历二叉树
输出:二叉树中结点的一个线性排列
后置条件:二叉树不变
PostOrder
前置条件:二叉树已存在
输入:无
功能:后序遍历二叉树
输出:二叉树中结点的一个线性排列
后置条件:二叉树不变
LeverOrder
前置条件:二叉树已存在
输入:无
功能:层序遍历二叉树
输出:二叉树中结点的一个线性排列
后置条件:二叉树不变
endADT
5.3.4二叉树的遍历操作
若二叉树为空,则空操作返回;否则:
①访问根结点;
②
前序
遍历
根
结点的左子树;
③
前序
遍历
根
结点的右子树。
中序(根)遍历
若二叉树为空,则空操作返回;否则:
①
中序
遍历
根
结点的左子树;
②访问根结点;
③
中序
遍历
根
结点的右子树。
后序(根)遍历
若二叉树为空,则空操作返回;否则:
①
后序
遍历
根
结点的左子树;
②
后序
遍历
根
结点的右子树。
③访问根结点;
层序遍历
二叉树的层次遍历是指从二叉树的第一层(即根结点)开始,
从上至下
逐层遍历,在同一层中,则按
从左到右
的顺序对结点逐个访问。
5.4二叉树的存储结构及实现
二叉树的顺序存储结构就是用一维数组存储二叉树中的结点,并且结点的
存储位
置
(下标)应能体现结点之间的
逻辑关系
——父子关系。
5.4.2二叉链表
基本思想:
令二叉树的每个结点对应一个链表结点,链表结点除了存放与二叉树结点有关的数据信息外,还要设置指示左右孩子的指针。
1.前序遍历递归算法
template <class DataType>
void BiTree<DataType> :: PreOrder(BiNode<DataType> *bt)
{
if (bt == NULL) return; //递归调用的结束条件
else {
cout << bt->data; //访问根结点bt的数据域
PreOrder(bt->lchild); //前序递归遍历bt的左子树
PreOrder(bt->rchild); //前序递归遍历bt的右子树
}
}
中序遍历递归算法
template <class DataType>
void BiTree<DataType> :: InOrder (BiNode<DataType> *bt)
{
if (bt == NULL) return; //递归调用的结束条件
else {
InOrder(bt->lchild); //中序递归遍历bt的左子树
cout << bt->data; //访问根结点bt的数据域
InOrder(bt->rchild); //中序递归遍历bt的右子树
}
}
后序遍历递归算法
template <class DataType>
void BiTree<DataType> :: PostOrder(BiNode<DataType> *bt)
{
if (bt == NULL) return; //递归调用的结束条件
else {
PostOrder(bt->lchild); //后序递归遍历bt的左子树
PostOrder(bt->rchild); //后序递归遍历bt的右子树
cout << bt->data; //访问根结点bt的数据域
}
}
层序遍历
template <class DataType>
void BiTree<DataType> :: LeverOrder( )
{
front = rear = -1; //采用顺序队列,并假定不会发生上溢
if (root == NULL) return; //二叉树为空,算法结束
Q[++rear] = root; //根指针入队
while (front != rear) //当队列非空时
{
q = Q[++front]; //出队
cout << q->data;
if (q->lchild != NULL) Q[++rear] = q->lchild;
if (q->rchild != NULL) Q[++rear] = q->rchild;
}
}
5.构造函数
——
建立二叉树
template <class DataType>
BiNode<DataType> *BiTree<DataType>::Creat(BiNode<DataType> *bt)
{
cin >> ch; //输入结点的数据信息,假设为字符
if (ch == '# ') bt = NULL; //建立一棵空树
else {
bt = new BiNode; bt->data = ch; //生成一个结点,数据域为ch
bt->lchild = Creat(bt->lchild); //递归建立左子树
bt->rchild = Creat(bt->rchild); //递归建立右子树
}
return bt;
}
5.4.3三叉链表
在二叉链表的基础上增加了一个指向双亲的指针域。
5.4.4线索链表
p
线索:
将二叉链表中的空指针域指向前驱结点和后继结点的指针被称为线索;
p
线索化:
使二叉链表中结点的空链域存放其前驱或后继信息的过程称为线索化;
p
线索链表:
加上线索的二叉链表称为线索链表。
中序线索链表的建立
——
构造函数
template <class DataType>
void InThrBiTree<DataType> ::ThrBiTree(ThrNode<DataType> *bt,
ThrNode<DataType> *pre)
{
if (bt == NULL) return;
ThrBiTree(bt->lchild, pre);
if (bt->lchild == NULL) { //对bt的左指针进行处理
bt->ltag = 1;
bt->lchild = pre; //设置pre的前驱线索
}
if (bt->rchild == NULL) bt->rtag = 1; //对bt的右指针进行处理
if (pre->rtag == 1) pre->rchild = bt; //设置pre的后继线索
pre = bt;
ThrBiTree(bt->rchild, pre);
}
template <class DataType>
ThrNode<DataType> *InThrBiTree<DataType> :: Next(
ThrNode<DataType> *p)
{
if (p->rtag == 1)
q = p->rchild; //右标志为1,可直接得到后继结点
else {
q = p->rchild; //工作指针q指向结点p的右孩子
while (q->ltag == 0) //查找最左下结点
q = q->lchild;
}
return q;
}
5.5
二叉树遍历的非递归算法
5.5.1前序遍历非递归算法
template <class DataType>
void BiTree::PreOrder(BiNode<DataType> *root)
{
top = -1; //采用顺序栈,并假定不会发生上溢
while (root != NULL || top != -1)
{
while (root != NULL)
{
cout<<root->data;
s[++top] = root;
root = root->lchild;
}
if (top != -1) {
root = s[top--];
root = root->rchild;
}
}
}
中序遍历
——
非递归算法
template <class DataType>
void BiTree::PreOrder(BiNode<DataType> *root)
{
top = -1; //采用顺序栈,并假定不会发生上溢
while (root != NULL || top != -1)
{
while (root != NULL)
{
s[++top] = root;
root = root->lchild;
}
if (top != -1) {
root = s[top--];
cout<<root->data;
root = root->rchild;
}
}
}
后序遍历
——
非递归算法
template <class DataType>
void BiTree<DataType> :: PostOrder(BiNode<DataType> *bt)
{
top = -1; //采用顺序栈,并假定栈不会发生上溢
while (bt != NULL || top != -1) //两个条件都不成立才退出循环
{
while (bt != NULL)
{
top++; s[top].ptr = bt; s[top].flag = 1; //root连同标志flag入栈
bt = bt->lchild;
}
while (top != -1 && s[top].flag == 2)
{
bt = s[top--].ptr; cout << bt->data;
}
if (top != -1) {
s[top].flag = 2; bt = s[top].ptr->rchild;
}
}
}
5.6树、
森林与二叉树的转换
树转换为二叉树:
⑴加线——树中所有相邻兄弟之间加一条连线。
⑵去线——对树中的每个结点,只保留它与第一个孩子结点之间的连线,删去它与其它孩子结点之间的连线。
⑶层次调整——以根结点为轴心,将树顺时针转动一定的角度,使之层次分明。
森林转换为二叉树:
⑴将森林中的每棵树转换成二叉树;
⑵从第二棵二叉树开始,依次把后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子,当所有二叉树连起来后,此时所得到的二叉树就是由森林转换得到的二叉树。
二叉树转换为树或森林
⑴加线——若某结点x是其双亲y的左孩子,则把结点x的右孩子、右孩子的右孩子、……,都与结点y用线连起来;
⑵去线——删去原二叉树中所有的双亲结点与右孩子结点的连线;
⑶层次调整——整理由⑴、⑵两步所得到的树或森林,使之层次分明。
森林的遍历 :
森林有两种遍历方法:
⑴前序(根)遍历:前序遍历森林即为前序遍历森林中的每一棵树。
⑵后序(根)遍历:后序遍历森林即为后序遍历森林中的每一棵树。
5.7
哈夫曼树及哈夫曼编码
叶子结点的权值:
对叶子结点赋予的一个有意义的数值量。
二叉树的带权路径长度:
设二叉树具有n个带权值的叶子结点,从根结点到各个叶子结点的路径长度与相应叶子结点权值的乘积之和。
哈夫曼树:
给定一组具有确定权值的
叶子
结点,带权路径长度最小的二叉树。
哈夫曼树的特点:
1. 权值越大的叶子结点越靠近根结点,而权值越小的叶子结点越远离根结点。
2. 只有度为0(叶子结点)和度为2(分支结点)的结点,不存在度为1的结点.
哈夫曼算法基本思想:
⑴
初始化
:由给定的n个权值{w1,w2,…,wn}构造n棵只有一个根结点的二叉树,从而得到一个二叉树集合F={T1,T2,…,Tn};
⑵
选取与合并
:在F中选取根结点的权值
最小
的两棵二叉树分别作为左、右子树构造一棵新的二叉树,这棵新二叉树的根结点的权值为其左、右子树根结点的权值之和;
⑶
删除与加入
:在F中删除作为左、右子树的两棵二叉树,并将新建立的二叉树加入到F中;
⑷
重复
⑵、⑶两步,当集合F中只剩下一棵二叉树时,这棵二叉树便是哈夫曼树。
哈夫曼树应用
——
哈夫曼编码
编码:给每一个对象标记一个二进制位串来表示一组对象。例:ASCII,指令系统
不等长编码:表示一组对象的二进制位串的长度不相等。
前缀编码
:一组编码中任一编码都
不是
其它任何一个编码的前缀。
前缀编码保证了在解码时不会有多种可能。