树
1》什么是树
树(Tree)是(n>=0)个节点的有限集合T,它满足两个条件:
(1)有且仅有一个特定的称为根(Root)的节点。
(2)其余的节点可以分为m(m≥0)个互不相交的有限集合T1、T2、……、Tm,其中每一个集合又是一棵树,并称为其根的子树(Subtree)。
树的特性:层次关系,一对多,每个节点最多有一个前驱,但是可以有多个后继(根节点无前驱,叶节点无后继)。
关于树的节点:和链表类似,树存储结构中也将存储的各个元素称为 "结点"。
2》关于树的一些术语
- 》度数:一个节点的子树的个数 (一个节点有几个孩子为该节点度数)
- 树度数:树中节点的最大度数
- 叶节点或终端节点: 度数为零的节点
- 分支节点:度数不为零的节点 (A B C D E H)
- 内部节点:除根节点以外的分支节点 (去掉根和叶子)
- 节点层次: 根节点的层次为1,根节点子树的根为第2层,以此类推
- 树的深度或高度: 树中所有节点层次的最大值
3》二叉树
最多只有俩孩子的树,并且分为左孩子和右孩子。
4》什么是二叉树
二叉树(Binary Tree)是n(n≥0)个节点的有限集合,它或者是空集(n=0), 或者是由一个根节点以及两棵互不相交的、分别称为左子树和右子树的二叉树组成。
二叉树与普通有序树不同,二叉树严格区分左孩子和右孩子,即使只有一个子节点也要区分左右。
5》二叉树性质(重点)
(1)二叉树第k(k>=1)层上的节点最多为2的k-1次幂 // 2^(k-1)
(2)深度为k(k>=1)的二叉树最多有2的k次幂-1个节点。//满二叉树的时候做多的节点数 2^k-1
(3)在任意一棵二叉树中,树叶的数目比度数为2的节点的数目多一。
设度数为0的节点数为n0,度数为1的节点数为n1以及度数为2的节点数为n2,则:
总节点数为各类节点之和: n = n0 + n1+ n2
总节点数为所有子节点数加一:n = n0*0 + n1*1 + n2*2 + 1
下面式子减上面式子得: 0 = -n0 + n2 +1 ==> n0 = n2 + 1
6》满二叉树和完全二叉树
满二叉树: 深度为k(k>=1)时节点数为2^k - 1(2的k次幂-1)
完全二叉树: 只有最下面两层有度数小于2的节点,且最下面一层的叶节点集中在最左边的若干位置上。(先挂树的左边向右, 从上向下挂)
7》二叉树的存储结构
1> 二叉树的顺序存储结构
顺序存储结构 :完全二叉树节点的编号方法是从上到下,从左到右,根节点为1号节点。设完全二叉树的节点数为n,某节点编号为 i :
- 当i>1(不是根节点)时,有父节点,其父节点编号为i/2;
- 当2*i<=n时,有左孩子,其编号为2*i ,否则没有左孩子,本身是叶节点;
- 当2*i+1<=n时,有右孩子,其编号为2*i+1 ,否则没有右孩子;
有n个节点的完全二叉树可以用有n+1 个元素的数组进行顺序存储,节点号和数组下标一一对应,下标为零的元素不用。
利用以上特性,可以从下标获得节点的逻辑关系。不完全二叉树通过添加虚节点构成完全二叉树,然后用数组存储,
2> 二叉树的遍历(重点)
前序:根 ----> 左 -----> 右
中序: 左 ----> 根 -----> 右
后序: 左 ----> 右 -----> 根
前序: A B C D E F G H K
中序:B D C A E H G K F
后序:D C B H K G F E A
8》二叉树的链式存储
用链表实现,基于完全二叉树规律来构建树,按照完全二叉树的编号方法,从上到下,从左到右。一共n个节点。
第i个节点:
左子节点编号:2*i (2*i<=n)
右子节点编号:2*i+1 (2*i+1<=n)
可以根据左右节点编号来判断是否对二叉树构建完成
代码展示:
#include <stdio.h>
#include <stdlib.h>
typedef struct node
{
int data; //数据域存数据
struct node *lchild; //左子
struct node *rchild; //右子
} node_t, *node_p;
//创建二叉树,用递归函数创建
node_p CreateBitree(int n, int i) //i 根节点的编号,n:节点数
{
//创建根节点
node_p r = (node_p)malloc(sizeof(node_t));
if (NULL == r)
{
perror("r malloc err");
return NULL;
}
//初始化根节点
r->data = i;
if (2 * i <= n)
r->lchild = CreateBitree(n, 2 * i);
else
r->lchild = NULL;
if (2 * i + 1 <= n)
r->rchild = CreateBitree(n, 2 * i + 1);
else
r->rchild = NULL;
return r;
}
//前序
void PreOrder(node_p r)
{
if (NULL == r)
return; //直接结束函数无返回值
printf("%d ", r->data); //根
if (r->lchild != NULL)
PreOrder(r->lchild); //左
if (r->rchild != NULL)
PreOrder(r->rchild); //右
}
//中序
void InOrder(node_p r)
{
if (NULL == r)
return; //直接结束函数无返回值
if (r->lchild != NULL)
InOrder(r->lchild); //左
printf("%d ", r->data); //根
if (r->rchild != NULL)
InOrder(r->rchild); //右
}
//后序
void PostOrder(node_p r)
{
if (NULL == r)
return; //直接结束函数无返回值
if (r->lchild != NULL)
PostOrder(r->lchild); //左
if (r->rchild != NULL)
PostOrder(r->rchild); //右
printf("%d ", r->data); //根
}
int main(int argc, char const *argv[])
{
node_p root = CreateBitree(5, 1);
PreOrder(root);
printf("\n");
InOrder(root);
printf("\n");
PostOrder(root);
printf("\n");
return 0;
}
运行结果:
9》层次遍历
10》哈夫曼树 Huffman
哈夫曼树又称为最优树.
给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。
先明确以下概念:
1、路径和路径长度
在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长度为L-1。
2、结点的权及带权路径长度
若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。
3、树的带权路径长度
树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL。(
Weighted Path Length of Tree)
WPL=2*2+5*2+7*1=21
哈夫曼树的构造:
假设有n个权值,则构造出的哈夫曼树有n个叶子结点。 n个权值分别设为 w1、w2、…、wn,则哈夫曼树的构造规则为:
(1) 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);
(2) 在森林中选出两个根结点的权值最小的树合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;
(3)从森林中删除选取的两棵树,并将新树加入森林;
(4)重复(2)、(3)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。
例如:对 2,3,4,8 这四个数进行构造:
今天的分享就到这里结束啦,如果有哪里写的不好的地方,请指正。
如果觉得不错并且对你有帮助的话请给个三连支持一下吧!