基于哈夫曼树的文件压缩

基本思想:
压缩:
1、统计出文件中相同字符出现的次数
2、获取哈夫曼编码
次数作为权值构建哈夫曼树
3、重新编码,写回压缩文件
保存头文件:
源文件后缀
编码信息的行数
每个字符的权
保存编码

解压缩:
1、获取原文件后缀
2、获取每个字符出现的次数,即权值
3、利用之前后的的权值,还原哈夫曼树
4、找到对应的叶子节点,将信息保存到解压文件中

在写压缩文件之前,首先需要实现堆和哈夫曼树

1,建堆

#include<iostream>
#include<vector>
using namespace std;
//利用仿函数的特性实现代码的复用性
template<class T>
struct Small
{
    bool operator()(const T& l, const T& r)
    {
        return l < r;
    }
};

template<class T>
struct Large
{
    bool operator()(const T& l, const T& r)
    {
        return l > r;
    }
};

template<class T, class Compare = Large<T>>  //缺省是建小堆
class Heap
{
public:
    Heap()
    {}
    Heap(const T *a, int size)
    {
        assert(a);
        _a.reserve(size);
        for (int i = 0; i<size; ++i)
        {
            _a.push_back(a[i]);
        }
        //建堆的时候从倒数第一个非叶子结点开始.
        for (int j = (size - 2) / 2; j >= 0; --j)
        {
            adjust_down(j);
        }
    }
    void Push(const T& x)
    {
        _a.push_back(x);
        adjust_up(_a.size() - 1);
    }
    void Pop()
    {
        assert(!_a.empty());
        swap(_a[0], _a[_a.size() - 1]);
        _a.pop_back();
        adjust_down(0);
    }
    size_t Size()
    {
        return _a.size();
    }
    bool Empty()
    {
        return _a.empty();
    }
    const T& Top()const
    {
        assert(!_a.empty());
        return _a[0];
    }
    void Display()
    {
        for (size_t i = 0; i<_a.size(); ++i)
        {
            cout << _a[i] << " ";
        }
        cout << endl;
    }
    void adjust_down(int root)
    {
        Compare com;
        int parent = root;
        int child = parent * 2 + 1;//parent的左孩子
        while (child < _a.size())
        {
            /*if rightchild > leftchild,child->right
            while 里面我们已经可以确定child(左孩子下标一定小于size
            但是我们不能保证右孩子的下标小于size,所以if语句里我们
            要判断一下,以免访问越界)
            */
            if (child + 1<_a.size() && com(_a[child + 1], _a[child]))
                //if (child + 1<_a.size() && _a[child + 1] > _a[child])
            {
                ++child;
            }
            if (com(_a[child], _a[parent]))//如果是>则为大堆
                //if (_a[child] > _a[parent])//if child>parent,swap
            {
                swap(_a[child], _a[parent]);
                parent = child;    //让parent指向child,继续向下调整
                child = child * 2 + 1;
            }
            else
                break;
        }
    }
    void adjust_up(int child)
    {
        Compare com;
        size_t parent = (child - 1) >> 1;
        
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
综合实验: 1. 问题描述 利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。 (2) E:编码(Encoding)。利用已建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。 (3) D:译码(Decoding)。利用已建好的哈夫曼树文件CodeFile中的代码进行译码,结果存入文件Textfile中。 (4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T:印哈夫曼树(Tree printing)。将已在内存中的哈夫曼树以直观的方式(比如树)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint 中。 3. 测试数据 用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAME IS MY FAVORITE”。 字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值