利用Haffman 算法实现对ascii字符文件的压缩

利用Haffman 算法实现对ascii字符文件的压缩    

EmilMatthew(EmilMatthew@126.com)

摘要: 

本文是对Haffman算法进行的一次实践。根据ascii码文件中各ascii字符出现的频率情况创建Haffman树,再将各字符对应的哈夫曼编码写入文件中。同时,亦可根据对应的哈夫曼树,将哈夫曼编码文件解压成字符文件.

 

关键词: Haffman算法,压缩,解压缩

 

                    Implement Haffman algorithm to the zipping of ascii file

                             EmilMatthew(EmilMatthew@126.com)

Abstract: 

       This article is a practice of haffman algorithm. First, I create the haffman tree based on the appearance frequency of each ascii character in the files ,then I output each ascii character’s corresponding haffman code to the zipped file. And I also make the program could unzip the haffman zipped files into the ascii files.

 

Key Words: Haffman Algorithm,Zip,UnZip  

      

1前言:

       Haffman算法是个简单而高效的贪心算法,主要用来创建最优二叉树.可以在通讯时,对于出现频率较高的字符,用较少的比特数便可以进行通讯.从而节省通讯线路的资源消耗。

该算法在各类数据结构, 算法,组合数学,离散数学,图论等主题的书籍中都有所涉及。故本文不再赘述,本文致力于用Haffman算法实现压缩与解压缩,采用的语言为C语言,编译环境VC++6.0.

       下面给出[1]中实现的Haffman树的结构及创建算法,有两点说明:

a)       这里的Haffman树采用的是基于数组的带左右儿子结点及父结点下标作为存储结点

的二叉树形式,这种空间上的消耗带来了算法实现上的便捷。

       b)  由于对于最后生成的Haffman树,其所有叶子结点均为从一个内部树扩充出去的,所以,当外部叶子结点数为m个时,内部结点数为m-1.整个Haffman树的需要的结点数为2m-1.

 

/*Code1: Haffman Algorithm*/

#define MAXCHAR 30000

       #define MAXNODE 300

       #define MAXNUM  150

       #define InfoType char

       struct HtNode

       {

              EBTreeType ww;

              char info;

              int parentIndex;

              int llinkIndex;

              int rlinkIndex;

       };

      

       struct HtTree

       {

              struct HtNode ht[MAXNODE];

              int rootIndex;

       };

      

       typedef struct HtTree* PHtTree;

 

PHtTree haffmanAlgorithm(int m,EBTreeType* w)

{

       PHtTree pht;

       int i,j;

       int firstMinIndex,secondMinIndex;

       int firstMinW,secondMinW;

      

       pht=(PHtTree)malloc(sizeof(struct HtTree));

      

       assertF(pht!=NULL,"in haffman algorithm,mem apply failure/n");

      

       /*Initialize the tree array*/

       for(i=0;i<2*m-1;i++)

       {

              pht->ht[i].llinkIndex=-1;

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
综合实验: 1. 问题描述 利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。 (2) E:编码(Encoding)。利用已建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。 (3) D:译码(Decoding)。利用已建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件Textfile中。 (4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T:印哈夫曼树(Tree printing)。将已在内存中的哈夫曼树以直观的方式(比如树)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint 中。 3. 测试数据 用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAME IS MY FAVORITE”。 字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值