大话数据结构学习笔记 - 树的基础知识
树的定义
树(Tree
)是
n(n≥0)
n
(
n
≥
0
)
个结点的有限集。
n=0
n
=
0
时称为空树。在任意一颗非空树中
有且仅有一个特定的称为根(
Root
)的结点当 n>1 n > 1 时,其余结点可分为 m(m>0) m ( m > 0 ) 个互不相交的有限集 T1、T2、......、Tm T 1 、 T 2 、 . . . . . . 、 T m , 其中每一个集合本身又是一棵树,并且称为根的子树(
SubTree
),如下图所示
注意
n>0 n > 0 时,根节点唯一,不存在多个根节点
m>0 m > 0 时,子树个数没有限制,但一定互不相交
树的概念
树的结点包含一个数据元素及若干指向其子树的分支。
度(Degree):结点拥有的子树树称为结点的度。度为
0
的结点称为 叶节点(Leaf
)或终端结点。度不为0
的结点称为非终端结点或分支结点。除根节点外,分支结点也称为内部结点。树的度就是树内各结点的度的最大值。结点的子树的根称为该结点的 孩子(
Child
), 相应的,该结点称为汉子的双亲(Parent
)。同一个双亲的孩子之间互称 兄弟(Sibling
)。结点的祖先是从根到该结点所经分支上的所有结点。以某结点为根的子树中的任一结点都称为该结点的 子孙结点的 层次(
Level
)从根开始定义起,根为第一层,根的孩子为第二层。树中结点的最大层次称为树的 深度(Depth
)或高度。比如下图树的深度为4
有序数:树中结点的各子树从左至右有次序,不能互换,否则为 无序树
森林(
Forest
):是 m(m>0) m ( m > 0 ) 课互不相交的树的集合
线性表和树的不同
树的抽象数据类型
ADT 树 (tree)
Data
树是由一个根节点和若干棵子树构成。树中结点具有相同数据类型及层次关系
Operation
InitTree(*T): 构造空树 T
DestroyTree(*T):销毁树 T
CreateTree(*T, definition):按 definitin 中给出树的定义来构造树
ClearTree(*T):若树 T 存在, 则将树 T清为空树
TreeEmpty(T): 若 T 为空树,返回 true, 否则返回 false。
TreeDepth(T): 返回 T 的深度
Root(T):返回 T 的根节点
Value(T, cur_e):cur_e 是树 T 中一个结点,返回此节点的值
Assign(T, cur_e, value):给树 T 的结点 cur_e 赋值为 value
Parent(T, cur_e):若 cur_e 是树 T 的非根节点,则返回它的双亲,否则返回空
LeftChild(T, cur_e):若 cur_e 是树 T 的非叶节点,则返回它的最左孩子,否则返回空
RightSibling(T, cur_e):若 cur_e 有右兄弟,则返回它的右兄弟,否则返回空
InsertChild(*T, *p, i, c):其中 p 指向树 T 的某个结点,i 为所指结点 p 的度加上 1, 非空树 c 与 T不相交, 操作结果为插入 c 为树 T 中 p 所指结点的第 i 课子树
DeleteChild(*T, *p, i):其中 p 指向树 T 的某个节点, i 为所指结点 p 的度,操作结果为删除 T 中 p 所指结点的第 i 棵子树
endADT
树的存储结构
双亲表示法
树的结点以一组连续空间表示,且在每个结点中,附设一个指示器指示其双亲结点到链表中的位置。
其中data
是数据域,存储结点的数据信息。而parent
是指针域,存储该结点的双亲在数组中的下标
/* 树的双亲表示法结点结构定义 */
typedef int TElemType; // 树结点的数据类型,目前暂定为整形
typedef struct PTNode // 结点结构
{
TElemType data; // 结点数据
int parent; // 双亲位置
}PTNode;
typedef struct // 树结构
{
PTNode nodes[MAX_TREE_SIZE]; // 结点数组
int r, n; // 根的位置和结点数
}PTree;
根节点没有双亲,故根节点的域设置为 -1
,双亲表示法根据parent
指针很容易找到它的双亲结点,时间复杂度为O(1)
。但无法确定结点的孩子,必须遍历整个结构。当然可以改进,比如增加孩子域,兄弟域等。
孩子表示法
把每个结点的孩子结点排列起来,以单链表作存储结构,则n
个结点有n
个孩子链表,如果是叶子节点则此单链表为空。然后n
个头指针又组成一个线性表,采用顺序存储结构,采用个顺序存储结构,存放进一个一维数组中。
为此,有两种结点结构
孩子链表的孩子结点,
child
为数据域,存储某个结点在表头数组中的下标,next
为指针域,存储指向下一孩子结点的指针表头数组的表头结点,
data
是数据域,存储某结点的数据信息。firstchild
是头指针域,存储该结点的孩子链表的头指针。
/* 树的孩子表示法结构定义 */
#define MAX_TREE_SIZE 100
typedef struct CTNode // 孩子结点
{
int child;
struct CTNode *next;
}*ChildPtr;
typedef struct // 表头结构
{
TElemType data;
ChildPtr firstchild;
}CTBox;
typedef struct // 树结构
{
CTBox nodes[MAX_TREE_SIZE]; //结点数组
int r, n; // 根的位置和结点数
}CTree;
优点是方便查找孩子以及兄弟结点
缺点:对于双亲则需要遍历整棵树。优化方法可以是添加 双亲域
孩子兄弟表示法
任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。故可设置两个指针,分别指向第一个孩子和此结点的右兄弟。
结点结构如下,其中data
是数据域,firstchild
是指针域,存储该结点的第一个孩子结点的存储地址,rightsib
是指针域,存储该结点的右兄弟结点的存储地址
/* 树的孩子兄弟表示法结构定义 */
typedef struct CSNode
{
TElemType data;
struct CSNode *firstchild, *rightsib;
}CSNode, *CSTree;
优点:将复杂树结构转换为二叉树,且对孩子和兄弟查找方便。
缺点:双亲查找麻烦,可增加双亲指针域优化
结语
关于树的整体知识整理到这里,后续会专门整理某些重要的树类型。