哈工大数据结构实验二——哈夫曼编码与译码方法

哈工大数据结构、算法设计、计算机系统、软件构造等所有实验我都会发布在博客上,我会慢慢更新的,如果对你有帮助的话,可以多多关注一下。


其他的实验链接

哈工大数据结构实验一 线性结构及其应用
哈工大数据结构实验1 算术表达式求值
哈工大数据结构实验2——二叉树存储结构的建立、遍历和应用
哈工大2019秋数据结构期末试题

在这里插入图片描述

对于本次实验,无非要解决的就是以下几个问题:

  1. 用什么数据结构去表示哈夫曼树

  2. 如何构造哈夫曼树

  3. 构造了哈夫曼树之后如何根据哈夫曼树将文本文件进行哈夫曼编码以及如何解码

本文将逐一阐述上述问题如何解决

  1. 首先,来看一下哈夫曼树的定义
    定义:给定n个权值作为n个子叶节点,若树的带权路径最短,则这课树被称为哈夫曼树。
  2. 这里要注意的几个点有:
    ①只有叶节点才有权重,非叶节点不存储字符,也不带权重
    ②什么是带全路径?带权路径就是叶节点到根节点的路径长度乘以叶节点所带的权重。比如下面这个二叉树的带权路径为:
    2x10 + 2x20 + 2x50 + 2x100 = 360
    ③哈夫曼树是带权路径最短的二叉树。

在这里插入图片描述
3. 好的,现在你已经知道哈夫曼树的定义,也了解了带权路径的定义。那么我们现在的目标就是构造出最短带权路径的二叉树。相信看到这里你已经有了构思,对于权重越大的叶节点,如果它离根节点越近,那么这个权重很大的叶节点对总的带权路径长度影响就越小。(right!)
比如对于上面的那个二叉树,对于权重为100的节点,如果我们把它放在离根节点最近的地方,50这个节点放在离根节点次近的地方,那么我们可以构造出一棵权重路径更小的二叉树。如图所示。
这棵树的权重路径为: 1x100 + 2x50 + 3x20 + 3x10 = 100 + 100 + 60 + 30 = 290 < 350。
在这里插入图片描述

看到这里,咱们的思路就清晰了,现在正式开始讲具体步骤。

假设有n个权重,构造出n个叶节点,n个权重分别为w1,w2…wn,哈夫曼树的构造规则如下:

  1. 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);
  2. 在森林中选出根结点的权值最小的两棵树进行合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;
  3. 从森林中删除选取的两棵树,并将新树加入森林;
  4. 重复(02)、(03)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。

以{5,6,7,8,15}为例,咱们试着构造一棵二叉树。

在这里插入图片描述

① 首先选出权值最小的两棵树进行合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;也就是选出5和6,合并成11,剩下的树的节点权重为{7,8,11,15}

在这里插入图片描述

②在剩下的树的节点权重为{7,8,11,15},选出最小的两个权重{7,8}构造棵新树,权重为15,剩下的节点权重为{11,15,15}

在这里插入图片描述
③同理,在剩下的节点权重为{11,15,15}选出{11,15},构造新的节点,其权重为26,剩下的节点为{15,26}

在这里插入图片描述

④最后,选择{15,26}构造根节点即可。

在这里插入图片描述
上述构造出的 二叉树就是哈夫曼树。
正确性证明点击这里看即可,本篇不在阐述

好的,现在重新回到我们开始提出的三个问题。

1.用什么数据结构去表示哈夫曼树

首先,每个节点需要存储权重,以及左右儿子,同时,为了讲两个节点合并构造一个新的父节点,我们也需要在每个节点存储父节点。

最好的数据结构就是使用静态三叉链表。
所有节点构成一个数组,节点的父子关系可以用数组下标表示。

#define N 53  //带权重的n个叶子节点数,根据文件中字符种类的个数来确定 
#define M 2*N-1 //n个叶子节点的哈夫曼树具有2*n-1个节点 
typedef struct{
   
     	float weight;//权重
 	int lchild;//左儿子
 	int rchild;//右儿子
 	int parent;//父亲  
}node;//静态三叉链表 
typedef node huffman[M]; //哈夫曼树 
typedef char *huffmancode[N];//存储每个字符的哈夫曼编码表 

2. 如何构造哈夫曼树

我的思路是:

  1. 给定n个权重,那么叶节点就有n个,非叶节点n-1个。那么首先初始化n个叶节点,包括初始化叶节点的权重,左儿子、右儿子、父亲初始化为-1。父亲为-1表示一开始所有的叶节点还没有选中来构造树。
  2. 然后就开始选择两个叶节点来构造一个新的节点,这个节点的权重为两个儿子的权重之和。选择策略是:从所有的没有父亲的节点找出两个权重最小的节点。这个功能我在函数selectmin中实现,其中参数s1,和s2传递的是引用,在函数内改变s1和s2的值,会直接改变函数外s1和s2的值。

具体实现如下:

void selectmin(huffman &T,int k,int &s1,int &s2):选出权重最小的两个节点

void selectmin(huffman &T,int k,int &s1,int &s2){
   //选出两个权重最小的节点 
	int min=1000000,tmp=0;
  	for(int i=0;i<=k;i++){
   
  	   if(T[i].parent==-1){
   
    	      if(min>T[i].weight){
   
     		 min=T[i].weight;
    		 tmp=i;
                }
   	   }
  	}
 	s1=tmp;
 	min=100000;
 	tmp=0;
  	for(int j=0;j<=k;j++){
   
   	   if((T[j].parent==-1)&&(j!=s1)){
   
   	      if(min>T[j].weight){
   
     		  min=T[j].weight;
      		  tmp=j;
    	      }
  	    }
 	 }
  	s2=tmp;  
}
void CreatTree(huffman &T,float *w,int n) {
   //构造哈夫曼树 
 	if(n<=1)
  	    return ;
  	int i;
 	for( i=0;i<n;i++){
   //初始化哈夫曼树的n个叶节点并赋予权重 
  	    T[i].weight=w[i];
            T[i].lchild=-1;
 	    T[i].rchild=-1;
  	    T[i].parent=-1;
 	}
	for(;i<
哈夫曼编码译码 包括默认编码 和 自定义编码 数据结构课程设计 一、题目: 哈夫曼编码/译码的设计实现 、目的要求 1、目的: 通过布置具有一定难度的实际程序设计项目,使学生进一步理解和掌握课堂上所学各种基本抽象数据类型的逻辑结构、存储结构和操作实现算法,以及它们在程序中的使用方法;使学生掌握分析问题,求解问题的方法并提高学生设计编程实现的能力。 2、要求: 基本要求: 1. 要求利用C\C++语言来完成系统的设计; 2. 突出C语言的函数特征(以多个函数实现每一个子功能)或者C++语言面向对象的编程思想; 3. 画出功能模块图; 4. 进行简单界面设计,能够实现友好的交互; 5. 具有清晰的程序流程图和数据结构的详细定义; 6. 熟练掌握C语言或者C++语言的各种操作。 创新要求: 在基本要求达到后,可进行创新设计,如系统用户功能控制,改进算法的实现,实现友好的人机交互等等 三、问题描述和求解方法: 首先根据给定的n个权值构造哈夫曼。通过遍历此完成哈夫曼编码。 四、解题过程 1. 分析程序的功能要求,划分程序功能模块。 2. 画出系统流程图。 3. 代码的编写。定义数据结构和各个功能子函数。 4. 程序的功能调试。 5. 完成系统总结报告以及使用说明书 五、进度安排 此次课程设计时间为一周,分以下几个阶段完成: 1. 选题搜集资料:每人选择一题,进行课程设计课题的资料搜集。 2. 分析概要设计:根据搜集的资料,进行程序功能数据结构分析,并选择合适的数据结构、并在此基础上进行实现程序功能的算法设计。 3. 程序设计:运用掌握C/C++语言编写程序,实现各个模块功能。 4. 调试测试:调试程序,并记录测试情况。 5. 完成课程设计报告。 6. 验收评分:指导教师对每个同学的开发的系统进行综合验收,并由学院考核小组进行随机抽查评分。 六、撰写课程设计报告或课程设计总结 课程设计报告要求: 课程设计报告要求规范书写,应当包括如下6个部分: 1. 问题描述 2. 基本要求 3. 系统分析设计 4. 测试数据及结果 5. 总结 6. 附录:源程序清单 七、答辩评分标准: 1 、作业文档: 50 分; 2 、基本功能和要求: 20 分; 2 、设计报告及使用说明书: 10 分; 3 、设置错误或者按照要求改变结果: 10 分; 4 、回答问题: 10 分。 八、参考资料 《数据结构(C语言版)》 网上相关资料(....) printf("---------------------------------------------\n"); printf(" 哈夫曼编码译码 \n"); printf(" 1.使用默认初始化 \n"); printf(" 2.使用自定义初始化 \n"); printf(" 3.进行哈夫曼编码 \n"); printf(" 4.进行哈夫曼译码 \n") ; printf(" 5.退出哈夫曼操作 \n"); printf(" 请输入1.2.3.4.5 \n"); printf(" ---------------------------------------------\n");
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值