哈夫曼编/译码器

YULIU_

已于 2023-02-01 09:21:09 修改

阅读量2.4k

点赞数 2

分类专栏： C语言数据结构算法文章标签： struct 编码

于 2016-12-29 10:57:10 首次发布

本文链接：https://blog.csdn.net/xuptacm/article/details/53925160

版权

本文介绍了哈夫曼编码的概念，它是一种用于数据无损压缩的一致性编码法，通过构建哈夫曼树实现。文章详细阐述了如何建立哈夫曼树，对文本进行编码和解码的过程，以及利用位操作进行文件压缩和解压的方法。

摘要由CSDN通过智能技术生成

哈夫曼编/译码器
利用哈夫曼编码进行信息通信可以大大提高信道利用率，缩短信息传输时间，降低传输成本。但是，这要求在发送端通过一个编码系统对待传数据预先编码，在接收端将传来的数据进行译码（复原）。

二. 设计内容
哈夫曼树─即最优二叉树，带权路径长度最小的二叉树，经常应用于数据压缩。在计算机信息处理中。
哈夫曼编码”是一种一致性编码法（又称“熵编码法”），用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符（例如某文件中的一个符号）进行编码。这张编码表的特殊之处在于，它是根据每一个源字符出现的估算概率而建立起来的（出现概率高的字符使用较短的编码，反之出现概率低的则使用较长的编码，这便使编码之后的字符串的平均期望长度降低，从而达到无损压缩数据的目的）。这种方法是由David.A.Huffman发展起来的。例如，在英文中，e的出现概率很高，而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时，e极有可能用一个位（bit)来表示，而z则可能花去25个位（不是26）。用普通的表示方法时，每个英文字母均占用一个字节（byte），即8个位。二者相比，e使用了一般编码的1/8的长度，z则使用了3倍多。若能实现对于英文中各个字母出现概率的较准确的估算，就可以大幅度提高无损压缩的比例。
利用哈夫曼编码进行信息通信可以大大提高信道利用率，缩短信息传输时间，降低传输成本。但是，这要求在发送端通过一个编码系统对待传数据预先编码，在接收端将传来的数据进行译码（复原）。对于双工信道（即可以双向传输信息的信道），每端都需要一个完整的编/译码系统。

——参考来自百度百科介绍
三．概要设计
1.建立哈夫曼树：读入文件(.souce)，统计文件中字符出现的频度，并以这些字符的频度作为权值，建立哈夫曼树。
2.编码：利用已建立好的哈夫曼树，获得各个字符的哈夫曼编码，并对正文进行编码，然后输出编码结果，并存入文件(.code)中。
3.译码：利用已建立好的哈夫曼树将文件(.code)中的代码进行译码，并输出译码结果，并存入文件(.decode)中。
4.利用位操作，实现文件的压缩与解压。

1.void tongji(); //统计字符出现频率，对其进行冒泡排序
2.void mima(); //密码登录界面
3.void Huffman(); //利用字符与出现频率作为权重，构造huffman树
4.void menu(); //菜单页面
5.void HuffmanCode();//为每个字符编码
6.void Encode(); //利用huffman树字符对应前缀为文件编码
7.void Decode(); //利用huffman树字符对应前缀为文件译码
8.void yasuo(); //利用位操作对huffman文件进行压缩将8位二进制化为一位十进制数
9.char bianyasuo(char str[]);//位操作将8位01数组化为一位十进制
10.void jieya(); //解压为二进制文件
设计字符的结构体（Count）其中包含字符（c）和出现次数（count）并且定义数组Leaf[maxsize]
struct Count
{
int c;
int count;
};
设计哈夫曼树的结构体（hufmtree），其中包含权重、左右孩子、父母和要编码的字符。用这个结构体（hufmtree）定义个哈夫曼数组（hufmtree tree[maxsize];）。
typedef struct
{
char ch;
int weight;
int lchild,rchild,parent;
}hufmtree;
hufmtree tree[1000];

设计编码类型的结构体（Codetype）其中包含字节（bits）和开始位置（start）还有与编码对应的字符（char ch）
typedef struct
{
char bits[3000];
int start;
char ch; //与编码对应的字符
}Codetype; Codetype code[maxsize];


#include<stdio.h>
#include<stdlib.h>
#include<io.h>
#include<conio.h>
/*  #define n 5  //叶子数目
    #define m (2*n-1)    //结点总数*/
#define maxval 1000
#define maxsize 100   //哈夫曼编码的最大位数
struct Count
{
        int c;
        int count;
};
typedef struct
{
     char ch;
     int weight;
     int lchild,rchild,parent;
}hufmtree; 
hufmtree tree[400];

typedef struct 
{ 
     char bits[400]; 
     int