哈夫曼树的应用:压缩文件

如果你还对哈夫曼树感到陌生的话,可以去看看这篇博客:
http://blog.csdn.net/fengasdfgh/article/details/52907353

思路:
压缩思路:
由于我们可以利用哈夫曼编码把文档中的每个字符表示为二进制编码.
比如文档里保存一个字符串“abbbcds”,我们可以通过统计每个字符出现的次数来构建哈夫曼树,这样每个字符有唯一的编码,如 a : 100, b : 0, c : 101, d : 110,
s : 111;
这样原字符串可表示为一个二进制序列:100 0 0 0 101 110 111。
接下来我们遍历这个二进制序列并每次以8位 得到一个数并把它作为一个字符写入一个文件,如果二进制序列的长度不是8的整数倍,我们可以补零直到为8的整数倍。
这就是我们的压缩文件。
压缩文件代码:

FILE *trans(const string str)
    {
        errno_t error;
        FILE* file;
        error = fopen_s(&file, str.c_str(), "rb");
        if (error)
        {
            throw 1;
        }
        Node *root = NULL;
        //我们构建哈夫曼树需要一个最小堆
        Plie<Node*, compare<Node *>> d;
        vector<unsigned long > count(256, 0);
        //contrat保存着每个字符所对应的编码
        map<int, string> contrast;
        //统计字符次数
        unsigned char va = 0;
        while (fread(&va, 1, 1, file) != 0 )
        {


            count[va]++;
        }
        fclose(pf);
        //将出现过的字符转化为Node
        for (int i = 0; i < 256; i++)
        {
            if (count[i] != 0)
            {
                Node *p = new Node(i, count[i]);
                d.push(p);
            }
        }
        //构建哈夫曼树
        root = construct(d);
        //记录字符所对应的新编码
        Tran(root, contrast);

        size_t pos = str.rfind('.');
        string s = str.substr(0, pos);
        string s1 = s + "configer.txt";

        //创建一个配置文件
        FILE *fff = NULL;
        error = fopen_s(&fff, s1.c_str(), "wb");
        if (error)
        {
            cout << s1.c_str() << ends;
            
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
综合实验: 1. 问题描述 利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。 (2) E:编码(Encoding)。利用已建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。 (3) D:译码(Decoding)。利用已建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件Textfile中。 (4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T:印哈夫曼树(Tree printing)。将已在内存中的哈夫曼树以直观的方式(比如树)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint 中。 3. 测试数据 用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAME IS MY FAVORITE”。 字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值