我们先来了解一下,什么是树;
树:树(Tree)是n(n>=0)个节点的有限集。n=0时称为空树。在任意一颗非空树中:(1)有且仅有一个特定的称为根(Root)的节点:(2)当n>1时,其余节点可分为m(m>0)个互不相交的有限集T1、T2、······、Tn,其中每一个集合本身又是一颗树,并且称为根的子树(SubTree)。
下来了解一下学习树会用到的一些关键词;
结点:结点拥有的子树称为结点的度。度为0的结点称为叶节点或终端结点;度不为0的结点称为非终端结点或分支结点。除根结点之外,分支结点也称为内部结点。树的度是树内各结点的度的最大值。如下图所示,因为这棵树结点的度的最大值是结点D的度,为3,所以数的度也为3。
节点间关系 :结点的子树的根称为该结点的孩子,相应地,该结点称为孩子的双亲。同一个双亲的孩子之间互称兄弟。结点的祖先是从根到该结点所经分支上的所有结点。
树的层次:结点的层次从根开始定义起,根为第一层,根的孩子为第二层。若某结点在第I层,则其子树的根就在第I+1层。其双亲在同一层的结点互为堂兄弟。树的结点的最大层次称为树的深度或高度,下图所示树的深度为4。
如果将树中结点的的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树;
森林是m(m>=0)颗互不相交的树的集合。对树中每个结点而言,其子树的集合即为森林。
下面来说一下树在计算机中最常用的三种表示方法:
- 双亲表示法
一个人可以没有孩子,但是他一定有且仅有一个双亲。我们假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点到链表中的位置。就是说结点除了知道自己是谁以外,还知道他的双亲在哪里。结构如下表所示。
data | parent |
---|
其中data是指针域,存储结点的数据信息 。而parent是指针域,存储该结点的双亲在数组中的下标。
结点结构定义代码:
/*树的双亲表示法的结点结构定义*/
#define MAX_TREE_SIZE 100
typedef int TElemType;/*树结点的数据类型,目前暂定为整型*/
typedef struct PTNode/* 结点结构*/
{
TElemType data;/*结点数据*/
int parent;/*双亲位置*/
}PTNode;
typedef struct/*树结构*/
{
PTNode nodes[MAX_TREE_SIZE];/*结点数组*/
int r,n;/*根的位置和结点树*/
}PTree;
用上面的结构定义我们就可以把下面的树表示为下表所示的定义方法:
下标 | data | parent |
---|---|---|
0 | A | -1 |
1 | B | 0 |
2 | C | 0 |
3 | D | 1 |
4 | E | 2 |
5 | F | 2 |
6 | G | 3 |
7 | H | 3 |
8 | I | 3 |
9 | J | 4 |
这样存储树,我们可以根据parent指针很容易找到他的双亲结点,时间复杂度为O(1)。但是如果要找一个结点的孩子,就要遍历整个结构才行,时间复杂度瞬间变为O(n);但是我们可以再此的基础上再加一个指针域,指向他的左孩子,如下表所示:
下标 | data | parent | firstchild |
---|---|---|---|
0 | A | -1 | -1 |
1 | B | 0 | 3 |
2 | C | 0 | 4 |
3 | D | 1 | 6 |
4 | E | 2 | 9 |
5 | F | 2 | -1 |
6 | G | 3 | -1 |
7 | H | 3 | -1 |
8 | I | 3 | -1 |
9 | J | 4 | -1 |
这样存储树,我们可以找到此结点的孩子结点了。但是我们如果要找一个结点的兄弟结点时,就需要遍历整个数组,时间复杂度就会大大增多了。我们此时可以定义一个新指针rightsib,指向他的右兄弟,同样如果右兄弟不存在就赋值为-1。表可以自己画一个,这里不再表示。
所以说:
存储结构的设计是一个非常灵活的过程。一个存储结构设计得是否合理,取决于基于该存储结构的运算是否合适、是否方便,时间否杂度好不好等。
2. 孩子表示法
每一个树中的每个节点可能有多棵子树,可以考虑用重链表,即每个节点有多个指针域,其中每个指针域指向一颗子树的根结点,我们把这种方法叫做多重链表表示法。不过,树的每个结点的度不同。所以有两种解决方案。
方案一:
指针域的个数等于树的度 。其结构如下表所示。
data | degree | child1 | child2 | ······ | childd |
---|
其中data是数据域。child1到childd是指针域,用来 指向该结点的孩子结点。用树表示为下图;
这种方法对于一个树中结点度的差距如果太大,对空间有大量的浪费。于是有了
第二种方案:
把每个结点的孩子结点排列起来,以单链表作存储结构,则n各节点有n个孩子链表,如果是叶子节点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组,入下图所示。
因此有两种结构,一个是孩子链表的孩子结点,如下表所示。
child | next |
---|
其中child是数据域,用来存储某个结点在表头数组中的下标。next是指针域,用来存储指向某结点的下一个孩子结点的指针。
另一个是表头数组的表头结点,如下表所示。
data | firstchild |
---|
其中data是数据域,存储某结点的数据信息。firstchild是头指针域,存储该结点的孩子链表的头指针。
孩子表示法定义结构体代码:
/*树的孩子表示法结构定义*/
#define MAX_TREE_SIZE 100
typedef struct CTNode/*孩子结点*/
{
int child;
struct CTNode* next;
}*ChildPtr;
typedef struct/*表头结构*/
{
TElemType data;
ChildePtr firstchild;
}CTBox;
typedef struct/*树结构*/
{
CTBox nodes[MAX_TREE_SIZE];/*结点数组*/
int r,n;
}CTree;/*根的位置和结点数*/
这种表示方法不能知道某个结点的双亲是谁,但我们可以把第一种表示方法和第二中结合一下,我们称为双亲孩子表示法,是孩子表示法的改进,如下图所示:
3. 孩子兄弟表示法
我们发现,任意一棵树,它的结点的第一个孩子如果存在就是唯一的,他的右兄弟如果存在也是惟一的。因此,我们设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。
结构表如下所示:
data | firstchild | rightsib |
---|
data为数据域,firstchild为指针域,存储该结点的第一个孩子结点的地址,rightsib是指针域,存储该结点的右兄弟结点的存储地址。
结构体代码如下:
/*树的孩子兄弟表示法结构定义*/
typedef struct CSNode
{
TElemType data;
struct CSNode* firstchild,*rightsib;
}CSNode,*CSTree;
用图表示为如下结构:
二叉树:二叉树(Binary Tree)是n(n>=0)个结点的有限集合,该集合或者为空集(称为二叉树),或者由一个根结点和两颗互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
二叉树的特点:每个结点最多有两颗子树、左子树和右子树是有顺序的,次序不能任意颠倒、即使树中某结点只有一颗子树,也要区分他是左子树 还是右子树。
特殊二叉树:
- 斜树:所有的结点都只有左子树的二叉树叫左斜树,同理所有结点只有右子树的二叉树叫右斜树。两者统称为斜树。
- 满二叉树:在一颗二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
- 完全二叉树:对一颗具有n个结点的为茶树按顺序编号,如果编号为i(1<=i<=n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同,则这颗二叉树称为完全二叉树。
二叉树的性质:
- 在二叉树的第i层上至多有2^(i-1)个结点(i>=1)。
- 深度为k的二叉树至多有(2^k)-1个结点(k>=1)。
- 对任何一颗二叉树T,如果其终端结点树为n0,度为2的结点数为n2,则 n0=n2+1。
- 具有n个结点的完全二叉树的深度为(=<log2n)+1。
- 如果对一棵树有n个结点的完全二叉树(其深度为(=<log2n)+1)的结点按层序编号,对任一结点i(1<=i<=n)有:
<1> 如果i=1,则结点i是二叉树的根,无双亲;如果i>1,则其双亲是结点<i/2。
<2>如果2i>n,则结点i无有孩子(结点i为叶子结点);负责其左孩子是结点2i。
<3>如果2i+1>n,则结点i无右孩子;否则其右孩子就是结点2*i+1;
二叉树的存储:二叉链表结点结构如下:
lchild | data | rchild |
---|
其中data是数据域,lchild和rchild都是指针域,分别存放左右孩子的指针。
二叉树结点结构定义代码:
/*二叉树的二叉链表结点结构定义*/
typedef struct BiTNode/*结点结构*/
{
int data;/*结点数据*/
struct BiTNode* lchild, *rchild;/*左右孩子指针*/
}BiTNode,*BiTree;
结构示意图如下:
遍历二叉树:遍历二叉树是指从根结点出发,按照某种次序依次访问二叉树中所有结点,使得每个结点被访问一次且仅被访问一次 。
- 前序遍历:若二叉树为空,则空操作返回,否则先访问根结点,然后前序遍历左子树,在前序遍历右子树。如下图所示遍历次序:
前序遍历的代码如下(这里只写函数下同):
void PreOrderTraverse(BiTree root)/*前序*/
{
if (root == NULL)
return;
printf("%d", root->data);
PreOrderTraverse(root->lchild);
PreOrderTraverse(root->rchild);
}
- 中序遍历:若二叉树为空,则空操作返回,否则从根结点开始(这里并不是先访问根结点),中序遍历根结点的所有左子树,然后是访问根结点,最后中序遍历右子树。如下图所示遍历次序:
中序遍历的代码如下:
void InOrderTraverse(BiTree root)/*中序*/
{
if (root == NULL)
return;
InOrderTraverse(root->lchild);
printf("%d", root->data);
InOrderTraverse(root->rchild);
}
- 后序遍历:若二叉树为空,则空操作返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后访问根结点。如下图所示遍历次序:
中序遍历的代码如下:
void PosOrderTraverse(BiTree root)/*后序*/
{
if (root == NULL)
return;
PosOrderTraverse(root->lchild);
PosOrderTraverse(root->rchild);
printf("%d,", root->data);
}
二叉树的输入函数为:
void CreateBiTree(BiTree* root)/*用前序遍历输入树*/
{
int e;
scanf("%d", &e);
if (e == 0)
*root = NULL;
else
{
*root = (BiTNode*)malloc(sizeof(BiTNode*));
(*root)->data = e;
CreateBiTree(&(*root)->lchild);
CreateBiTree(&(*root)->rchild);
}
}
如下图的输入次序应为3760059000820041000:
这里只说了一些基础知识,和代码;其他一些比较难的如“平衡树”,“红黑树”,等后续可能会说。