1.树的概念及结构
1.1树的概念
树是一种非线性的数据结构,它是由n个有限节点组成的一个具有层次关系的集合,把它叫做树是因为它看起来像一个倒挂的树,即根朝上,而叶朝下。
一个特殊的节点是根节点,根节点没有没有前驱节点。
除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继因此,树是递归定义的。
注意:子树之间不可以有交集,否则就不是图了。
1.2树的相关概念
除了根节点外,每个节点有且仅有一个父节点
一颗N个节点的树有N-1条边
节点的度:一个节点含有的子树个数叫做该节点的度;如上图为3
叶节点或终端节点:度为0的节点称为叶节点;如H,I,J…
非终端节点或分支节点:度不为0的节点;如B,D…
双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;
兄弟节点:具有相同父节点的节点互称为兄弟节点;
树的度:一棵树中,最大的节点的度称为树的度;
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度:树中节点的最大层次;
堂兄弟节点:双亲在同一层的节点互为堂兄弟;
森林:由m(m>0)棵互不相交的树的集合称为森林;
1.3 树的表示
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};
2.二叉树的概念及结构
2.1 概念
一颗二叉树是节点的一个有限集合,该集合:
1.或者为空
2.由一个根节点加上两颗分别称为左子树和右子树的二叉树组成
由上图也可以看出来,二叉树不存在度大于2的节点,二叉树的子树由左子树和右子树之分,次序不可以颠倒,因此二叉树也是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:
2.2 现实中的二叉树
2.3 特殊的二叉树
- 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是 2^k-1则它就是满二叉树。
- 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K
的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对
应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
2.4 二叉树的性质
1.如果规定根节点的层数为1,那么一颗非空二叉树的第i层最多有2^(i-1)个节点。
2.若规定根节点的层数为1,则深度为h的二叉树的最大结点数是 2^h-1.
3. 对任何一棵二叉树, 如果度为0其叶结点个数为 n1, 度为2的分支结点个数为 n2,则有 n1=n2+1.
4. 若规定根节点的层数为1,具有n个结点的满二叉树的深度,h=log 2 (n+1) ->是log以2为底,n+1为对数
2.5 二叉树的存储结构
二叉树一般有两种结构储存,一种是顺序结构,一种是链式。
1.顺序结构
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
2.链式二叉树
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链,后面课程学到高阶数据结构如红黑树等会用到三叉链。
typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
}
// 三叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pParent; // 指向当前节点的双亲
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
};
3,二叉树的顺序结构及实现
3.1 二叉树的顺序结构
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
3.2堆的概念及结构
如果有一个关键码的集合K = { k0,k1 ,k2 ,…,k(n-1) },把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足: ki<=k(2i+1) 且 ki<= k(2i+2)(ki >=k(2i+1) 且ki >=k(2i+2) ) i = 0,1,2…,则称为小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。堆的性质:
1.堆中某个节点的值总是不大于或不小于其父节点值;
2.堆总是一棵完全二叉树。
堆在不同地方的意义
3.3 堆的实现
3.2.1 堆向下调整算法
现在我们给出一个数组,逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提:左右子树必须是一个堆,才能调整。
int array[] = {27,15,19,18,28,34,65,49,25,37};
3.2.2 堆的创建
下面我们给出一个数组,这个数组逻辑上可以看做一颗完全二叉树,但是还不是一个堆,现在我们通过算法,把它构建成一个堆。根节点左右子树不是堆,我们怎么调整呢?这里我们从倒数的第一个非叶子节点的子树开始调整,一直调整到根节点的树,就可以调整成堆。
int a[] = {1,5,3,8,7,6};
3.2.3 堆的向上调整(包含对的插入)
下面以一个例子来说明
15,18,19,25,28,34,65,49,27,37 这是一个在逻辑上满足小堆的数组
操作一:在这个堆后面插入数字30,要插入30,那么用30的下标减1,再除二,找到它的父亲节点,即28,这里30作为孩子节点满足孩子节点小于父亲节点,所以不需要调整,依然是小堆。
操作二:在这个堆后面插入20。先找到插入这个数的父亲节点,即计算20的下标然后除2得到父亲节点的下标,得到父亲节点的值为28发现大于孩子节点20,所以要进行调整,将20与28换一下位置,然后重复上一步,得到现在20的父亲节点的下标,即18的下标,比较18与20, 发现父亲节点的18小于孩子节点的20,满足小堆的要求,所以向上调整结束。
,
操作三:在堆后面插入10.这里的步骤也和前面一样,只是折里需要调整两次了。一次与28换,然后再和15换
3.2.4 堆的删除
删除堆是删除堆顶的数据。具体操作是将堆顶的数据先和最后一个数据互换,然后删除掉最后一个数据,再进行向下调整的算法。
3.2.5 堆代码的实现
#include<stdio.h>
#include"stdbool.h"
#include"stdlib.h"
#include"assert.h"
typedef int HPDataType;
typedef struct Heap
{
HPDataType* a;
int size;
int capacity;
}Heap;
// 堆的构建
void HeapCreate(Heap* hp, HPDataType* a, int n);
// 堆的销毁
void HeapDestory(Heap* hp);
// 堆的插入
void HeapPush(Heap* hp, HPDataType x);
// 堆的删除
void HeapPop(Heap* hp);
// 取堆顶的数据
HPDataType HeapTop(Heap* hp);
// 堆的数据个数
int HeapSize(Heap* hp);
// 堆的判空
int HeapEmpty(Heap* hp);
交换数据
void Swap(int* a,int *b)
{
int tem = *a;
*a = *b;
*b = tem;
}
先创建一个堆
void HeapCreate(Heap* hp, HPDataType* a, int n)
{
assert(hp);
hp->a = NULL;
hp->size = 0;
hp->capacity = 0;
for (int i = 0; i<n; i++)
{
HeapPush(hp,a[i]); //将数组里面的数据放到创建的堆里面
}
}
堆的销毁
void HeapDestory(Heap* hp)
{
free(hp->a);
hp->a = NULL;
hp->size = hp->capacity = 0;
}
向上调整
void AdjustUP(HPDataType* a,int child)
{
int parent = (child - 1) / 2;
while (child>0) //其实当child为0时结束
{
if (a[child]<a[parent])
{
swap(&a[child],&a[parent]); //这里是将地址传过去,但是最终只是利用地址将数改了,地址还是没变
child = parent;
parent = (child - 1) / 2;
}
else
{
break;
}
}
}
向堆里面插入数据
void HeapPush(Heap* hp, HPDataType x)
{
assert(hp);
//先判空间是否足够再扩容
if (hp->size==hp->capacity)
{
int newcapacity = hp->capacity == 0 ? 4 : hp->capacity * 2;
HPDataType* tem = (HPDataType*)realloc(hp->a, newcapacity * sizeof(HPDataType));
if (tem == NULL)
{
perror("ralloc fail");
exit(-1);
}
hp->a = tem;
hp->capacity = newcapacity;
}
hp->a[hp->size] = x;
hp->size++;
//前面这些都是为了进行尾插,将数值插进去,下面就是将插入的数字进行向上调整
AdjustUP(hp->a, hp->size - 1); //size-1 传的是最后一个元素也就是刚刚插入的元素x的下标
}
向下调整
void AdjustDown(int* a,int size,int parent)
{
//假设比较小的是左边的child
int child = (parent * 2 )+ 1;
while (child<size)
{
if (child+1<size&&a[child]>a[child+1])
{
swap(&a[child],&a[child+1]);
}
if (a[child] < a[parent])
{
swap(&a[child], &a[parent]);
parent = child;
child = child * 2 + 1;
}
else
{
return;
}
}
}
删除数据(删除顶部元素)
void HeapPop(Heap* hp)
{
assert(hp);
assert(hp->size > 0); //注意在这里是size>0; 代表只要有元素就可以
swap(&hp->a[0], &hp->a[hp->size - 1]);
hp->size=hp->size-1;
AdjustDown(hp->a, hp->size,0);
}
取堆顶的元素
HPDataType HeapTop(Heap* hp)
{
assert(hp);
assert(hp->size>0);
return hp->a[0];
}
堆中的元素个数
int HeapSize(Heap* hp)
{
assert(hp);
return hp->size;
}
判断堆是否为空
int HeapEmpty(Heap* hp)
{
assert(hp);
return hp->size = 0;
}