数据结构笔记（树、二叉树与森林哈夫曼）

最新推荐文章于 2022-10-07 12:10:53 发布

哲siegel

最新推荐文章于 2022-10-07 12:10:53 发布

阅读量408

点赞数

分类专栏：笔记数据结构

本文链接：https://blog.csdn.net/qq_43470484/article/details/103115493

版权

数据结构同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

笔记

16 篇文章 0 订阅

订阅专栏

一、树和二叉树之间的对应关系

（一）树：兄弟关系=二叉树：双亲和右孩子
（二）树：双亲和长子=二叉树：双亲和左孩子
树的前序遍历等价于二叉树的前序遍历
树的后序遍历等价于二叉树的中序遍历

二、森林、树、二叉树的转换

（一）森林转换为二叉树
1、将森林中的每棵树转换成二叉树；
2、从第二棵二叉树开始，依次把后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子，当所有二叉树连起来后，此时所得到的二叉树就是由森林转换得到的二叉树。
3、森林的两种遍历方法：
⑴前序（根）遍历：前序遍历森林即为前序遍历森林中的每一棵树。
⑵后序（根）遍历：后序遍历森林即为后序遍历森林中的每一棵树。
（二）二叉树转换为树或森林
1、加线——若某结点x是其双亲y的左孩子，则把结点x的右孩子、右孩子的右孩子、……，都与结点y用线连起来；
2、去线——删去原二叉树中所有的双亲结点与右孩子结点的连线；
3、层次调整——整理由⑴、⑵两步所得到的树或森林，使之层次分明。

三、最优二叉树-哈夫曼树及哈夫曼编码

（一）相关概念
1、叶子结点的权值：对叶子结点赋予的一个有意义的数值量。
2、二叉树的带权路径长度（WPL）：设二叉树具有n个带权值的叶子结点，从根结点到各个叶子结点的路径长度与相应叶子结点权值的乘积之和。
3、哈夫曼树：给定一组具有确定权值的叶子结点，带权路径长度最小的二叉树。
（二）哈夫曼树的特点：

权值越大的叶子结点越靠近根结点，而权值越小的叶子结点越远离根结点。
只有度为0（叶子结点）和度为2（分支结点）的结点，不存在度为1的结点.
（三）哈夫曼算法基本思想：
1、初始化：由给定的n个权值{w1，w2，…，wn}构造n棵只有一个根结点的二叉树，从而得到一个二叉树集合F＝{T1，T2，…，Tn}；
2、选取与合并：在F中选取根结点的权值最小的两棵二叉树分别作为左、右子树构造一棵新的二叉树，这棵新二叉树的根结点的权值为其左、右子树根结点的权值之和；
3、删除与加入：在F中删除作为左、右子树的两棵二叉树，并将新建立的二叉树加入到F中；
4、重复⑵、⑶两步，当集合F中只剩下一棵二叉树时，这棵二叉树便是哈夫曼树。
（四）哈夫曼算法的存储结构
设置一个数组huffTree[2n-1]保存哈夫曼树中各点的信息，数组元素的结点结构。
|weight|lchild|rchild|parent|
其中：weight：权值域，保存该结点的权值；
lchild：指针域，结点的左孩子结点在数组中的下标；
rchild：指针域，结点的右孩子结点在数组中的下标；
parent：指针域，该结点的双亲结点在数组中的

struct element
{     int weight;
     int lchild, rchild, parent;
};

伪代码
1.数组huffTree初始化，所有元素结点的双亲、左
右孩子都置为-1；
3. 数组huffTree的前n个元素的权值置给定值w[n]；
4. 进行n-1次合并
3.1 在二叉树集合中选取两个权值最小的根结点，
其下标分别为i1, i2；
3.2 将二叉树i1、i2合并为一棵新的二叉树k(初值为n；依次递增)；

void HuffmanTree(element huffTree[ ], int w[ ], int n ) {
    for (i=0; i<2*n-1; i++) {
       huffTree [i].parent= -1;
       huffTree [i].lchild= -1;
       huffTree [i].rchild= -1;   
    }
    for (i=0; i<n; i++) 
       huffTree [i].weight=w[i];
    for (k=n; k<2*n-1; k++) {
        Select(huffTree, &i1, &i2); 
        huffTree[k].weight=huffTree[i1].weight+huffTree[i2].weight;
        huffTree[i1].parent=k;     
        huffTree[i2].parent=k; 
        huffTree[k].lchild=i1;    
        huffTree[k].rchild=i2;
    }
}

（五）哈夫曼树应用——哈夫曼编码
1、编码：给每一个对象标记一个二进制位串来表示一组对象。
例：ASCII，指令系统
2、等长编码：表示一组对象的二进制位串的长度相等。
3、不等长编码：表示一组对象的二进制位串的长度不相等。
3、前缀编码：一组编码中任一编码都不是其它任何一个编码的前缀。
前缀编码保证了在解码时不会有多种可能。
（六）哈夫曼编码算法的实现
1、从叶子结点到根，逆向求每个叶子结点对应的哈夫曼编码
根据huffman树中叶子节点的个数，构造一个字符串数组，每个数组分量是一个字符串，用于存放该节点对应的huffman编码，对每个叶子节点i(i=0; i<n; i++)，进行下面的工作：
1 cd［n-1］＝′\0′； /*cd是一个字符数组，共有n个元素，即每个字符编码的长度不超过n。从右向左逐位存放编码，首先存放编码结束符
2 start=n-1; /*初始化编码起始指针
3 for(c=i, p= huffTree [i].parent; p! =0; c=p, p= huffTree [p].parent) /i是要编码的叶子节点编号，从叶子到根结点求编码/
if(huffTree [p].LChild==c) cd［–start］=‘0’ /左分支标0/
else cd［–start］=‘1’; /右分支标1/
4 循环结束，完成一个字符的编码
5 重复上述工作，直到完成所有节点的编码