1.树
1.1树的概念
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成的一个具有层次关系的集合。把它叫做树是因为他的形状和倒挂的树一样。
树的特点:
树有一个特殊的节点,叫根节点,根节点没有前驱节点。
除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i<= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,同时可以有0个或多个后继。
可以说树是套娃定义的,树里面有子树,子树里又有子树,树是递归定义的。
注意:树形结构中,子树之间不能有交集(不能成环),否则就不是树形结构
1.2树的各种专有名词
节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为6;
叶节点或终端节点:度为0的节点称为叶节点; 如上图:B、C、H、I...等节点为叶节点;
非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G...等节点为分支节点;
双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点;
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点;
兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点;
树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6;
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度:树中节点的最大层次; 如上图:树的高度为4;
堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点;
节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先;
子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙;
森林:由m(m>0)棵互不相交的树的集合称为森林;
1.3 树的表示
相对与线性表的存储,树结构的存储要复杂些,既要保存值,又要保存结点和结点之间的关系,实际中树有很多中表示方式:双亲表示法,孩子表示法,孩子双亲表示法以及孩子兄弟表示法等。下面讲解其中最常见的孩子兄弟表示法。
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};
此种表示法就可以在单个节点中仅存两个指针和一个值,从而表示所有树形结构,例如:
2.二叉树
2.1二叉树概念
二叉树是节点组成的有限集合,该集合:
为空,
或者由一个根节点加上两颗称为左子树和右子树的二叉树组成。
同时:
二叉树不存在度大于2的结点
二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
任意的二叉树都可以拆分为以下情况:
2.2 特殊二叉树
1. 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是2^k-1 ,则它就是满二叉树。
2. 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
2.3 二叉树的性质
1. 若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有2^(i-1)个结点.
2. 若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2^h-1.
3. 对任何一棵二叉树, 如果度为0其叶结点个数为n0, 度为2的分支结点个数为n2,则有n0=n2 +1
4. 若规定根节点的层数为1,具有n个结点的满二叉树的深度,h = .
5. 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
1. 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
2. 若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子
3. 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子
2.4 二叉树的存储结构
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
1. 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储。
二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
提示:顺序存储可以结合上面二叉树性质第五条理解,二叉树的编号就是数组中的下标。
2. 链式存储
二叉树的链式存储结构是指用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链。
示图如下:
2.5二叉树顺序结构实现
一般的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
2.5.1堆的概念以及结构
如果有一个关键码的集合K = {,,,...,},把他所有的元素按照二叉树的顺序结构方式存储在一个一维数组中,并且满足<= 并且 <=
( >= 且>=) i = 0,1...,则称为小堆(或大堆)。
如果你还记得上面二叉树性质中二叉树节点编号间的关系就可以发现,小堆的概念就是双亲节点存储值小于等于孩子节点存储值,同理可以推出大堆的概念。
所以说堆的性质有:
堆中某个节点的值总是不大于或不小于其双亲节点的值;
堆总是一棵完全二叉树。
结合视图理解:
2.5.2堆的应用
堆的结构可以实现堆排序算法,我后续会专门出一篇文章详细梳理堆以及堆算法的实现。
2.6二叉树链式结构的实现
2.6.1二叉树前序,中序以及后序遍历
要实现二叉树链式结构的创建,首先要学会二叉树的遍历,所谓二叉树遍历(Traversal)是按照某种特定的规则,依次对二叉树中的节点进行相应的操作,并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,也是二叉树上进行其它运算的基础。
二叉树的遍历有:前序/中序/后序的递归结构遍历:
1. 前序遍历(Preorder Traversal 亦称先序遍历)——访问根结点的操作发生在遍历其左右子树之前。(遍历顺序 : 根-->左子树-->右子树)
2. 中序遍历(Inorder Traversal)——访问根结点的操作发生在遍历其左右子树之中(间)。
(遍历顺序 : 左子树-->根-->右子树)
3. 后序遍历(Postorder Traversal)——访问根结点的操作发生在遍历其左右子树之后。
(遍历顺序 :左子树-->右子树-->根)
由于被访问的结点必是某子树的根,所以N(Node)、L(Left subtree)和R(Right subtree)又可解释为根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。
二叉树的遍历是一种递归的思想,通过具体代码进一步理解:
假设我们有一个二叉树,其中节点存储数据为字符,我们可以这样遍历并输出该树:
void BinaryTreePrevOrder(BTNode* root);//二叉树前序遍历
void BinaryTreeInOrder(BTNode* root);//二叉树中序遍历
void BinaryTreePostOrder(BTNode* root);//二叉树后序遍历
void BinaryTreePrevOrder(BTNode* root)//二叉树前序遍历
{
if (root == NULL)
{
printf("#");
return;
}
printf("%c", root->data);
BinaryTreePrevOrder(root->left);
BinaryTreePrevOrder(root->right);
}
void BinaryTreeInOrder(BTNode* root)//二叉树中序遍历
{
if (root == NULL)
{
printf("#");
return;
}
BinaryTreeInOrder(root->left);
printf("%c", root->data);
BinaryTreeInOrder(root->right);
}
void BinaryTreePostOrder(BTNode* root)//二叉树后序遍历
{
if (root == NULL)
{
printf("#");
return;
}
BinaryTreePostOrder(root->left);
BinaryTreePostOrder(root->right);
printf("%c", root->data);
}
若有以上二叉树,通过前/中/后序遍历并输出得到的结果为:
前序:ABD##E#H##CF##G##
中序:#D#B#E#H#A#F#C#G#
后序:##D###HEB##F##GCA
2.6.2二叉树创建
理解前/中/后序遍历就可以开始实现二叉树创建了,我这里以前序遍历创建二叉树为例子:
BTNode* BinaryTreeCreate(BTDataType* a, int n, int* pi);//通过前序遍历的数组"ABD##E#H##CF##G##"构建二叉树
BTNode* BinaryTreeCreate(BTDataType* a, int n, int* pi)//通过前序遍历的数组"ABD##E#H##CF##G##"构建二叉树
{
BTNode* newnode = BuyBTNode();//BuyBTNode为创建节点的函数(malloc)
if (*pi < n)
{
if (a[*pi] == '#')
{
(*pi)++;
return NULL;
}
newnode->data = a[(*pi)++];
newnode->left = BinaryTreeCreate(a, n, pi);
newnode->right = BinaryTreeCreate(a, n, pi);
return newnode;
}
}
可以通过输入符合条件的字符串来创建对应的数组,例如以上例子中输入的"ABD##E#H##CF##G##",这个字符串是待创建树前序遍历输出的结果,我们按照前序遍历的原则进行读取,运用递归的思想,把二叉树拆成若干个小的子树,再将数据分别存储进根,左子树和右子树中。(PS:int* pi为外部变量的指针,可以这样实现递归过程中数组不重复的向后遍历,改变量初始值可设为0)
2.6.3二叉树的层序遍历
层序遍历:除了先序遍历、中序遍历、后序遍历外,还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1,层序遍历就是从所在二叉树的根节点出发,首先访问第一层的树根节点,然后从左到右访问第2层上的节点,接着是第三层的节点,以此类推,自上而下,自左至右逐层访问树的结点的过程就是层序遍历。
层序遍历可以通过队列辅助实现,具体代码如下:
void BinaryTreeLevelOrder(BTNode* root)//二叉树层序遍历
{
Queue q;
QueueInit(&q);
QueuePush(&q, root);
while (!QueueEmpty(&q))
{
BTNode* pb = QueueFront(&q);
QueuePop(&q);
if (pb)//如果取出的节点不为空,带出子节点
{
printf("%c", pb->data);
QueuePush(&q, pb->left);
QueuePush(&q, pb->right);
}
else
{
printf("#");
}
}
QueueDestroy(&q);
}
可以看到,其过程为先将根节点入队列,再使根节点出栈同时其孩子节点入栈,之后孩子节点也视为根节点,像这样出一个入几个,出几个入几个,就保证了上层节点出栈后,下层节点依次带入,所有节点的出栈顺序就是层序遍历的顺序。
其效果大致如下: